本文主要探讨人工智能的整体学习路径,相当于数据分析模块的起点。理解整体思维框架有助于更清晰地规划后续的学习内容及目标程度,对单一 AI 绘制短剧小说等热门方向也有重要参考价值。掌握基础知识有助于更加灵活地创造和应用解决问题的能力。
狭义 AI(ANI):在特定任务上表现出色(如图像识别、语音转文字)。
通用 AI(AGI):尚未实现,具有人类水平的泛化推理能力。
当前主流 AI = 数据 + 算法 + 计算资源 + 工程应用
┌───────────────────────────────┐
│ 应用层(智能体 / Agent) │ ← 用户交互、业务场景(如客服机器人、文生图)
├───────────────────────────────┤
│ 编排层(LangChain / MCP / Workflow) │ ← 串联模型、工具、记忆、决策逻辑
├───────────────────────────────┤
│ 大模型层(LLM / Multimodal) │ ← GPT、LLaMA、Stable Diffusion、CLIP、ViT
├───────────────────────────────┤
│ 深度学习框架(PyTorch / TensorFlow) │ ← 构建神经网络、训练/推理
├───────────────────────────────┤
│ 机器学习库(scikit-learn) │ ← 经典 ML 算法快速验证
├───────────────────────────────┤
│ 数据处理与可视化(pandas / numpy / matplotlib)│ ← 数据清洗、探索、转换
├───────────────────────────────┤
│ Python 编程基础 │ ← 语法、函数、面向对象、调试
└───────────────────────────────┘
核心理念:先会使用,再理解原理;先运行通顺,再进行优化——从应用逆向推导底层逻辑,形成闭环反馈式学习。
目标:掌握 Python 及数据处理基本技能,为后续建模打下坚实基础。
推荐资源:《Automate the Boring Stuff with Python》
| 工具 | 作用 | 关键技能 |
|---|---|---|
| NumPy | 高效数值计算 | 、广播机制、矩阵运算、索引切片 |
| Pandas | 结构化数据处理 | 、缺失值处理、、合并、时间序列 |
| Matplotlib / Seaborn | 数据可视化 | 散点图、直方图、箱线图、热力图、子图布局 |
目标:理解“特征 → 模型 → 评估 → 优化”的完整 ML 流程。
| 任务类型 | 算法示例 | 应用场景 |
|---|---|---|
| 分类 | Logistic Regression, Random Forest, SVM | 垃圾邮件识别、客户流失预测 |
| 回归 | Linear Regression, XGBoost | 房价预测、销量预测 |
| 聚类 | K-Means, DBSCAN | 用户分群、异常检测 |
关键 API 模式:
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
scipy.stats
假设检验、概率分布
scipy.optimize:理解优化器原理(为深度学习铺垫)
目标:掌握张量操作、自动求导、网络构建与训练流程。
| 维度 | PyTorch | TensorFlow |
|---|---|---|
| 学习曲线 | 更 Pythonic,易于调试 | 静态图复杂,但部署生态系统强大 |
| 科研使用 | 主流(>80% 论文) | 较少 |
| 工业部署 | TorchServe, ONNX | TF Serving, TFLite, TF.js |
建议:初学者首选 PyTorch
多维数组,支持 GPU 加速
自动微分(反向传播)
网络定义标准方式
高效批量加载数据
MSE、CrossEntropy + Adam/SGD
能独立完成“数据加载 → 模型定义 → 训练循环 → 评估保存”全流程。
核心技术栈:
典型任务与模型:
| 任务 | 模型 | 工具 |
|---|---|---|
| 图像分类 | ResNet, ViT | torchvision.models |
| 目标检测 | YOLOv8, Faster R-CNN | Ultralytics, MMDetection |
| 图像分割 | U-Net, SAM | segmentation_models_pytorch |
项目建议:
核心技术栈:
关键演进路径:
One-Hot → Word2Vec/GloVe → RNN/LSTM → Transformer → BERT/GPT
典型任务:
| 任务 | 模型 | 方法 |
|---|---|---|
| 文本分类 | BERT | 微调分类头 |
| 命名实体识别 | BERT+CRF | 序列标注 |
| 问答系统 | RoBERTa | SQuAD 微调 |
项目建议:
bert-base-chinese
核心转变:
预训练 + 微调 + 提示工程(Prompt Engineering)
[用户输入]
↓
[规划器 Planner] → 决定是否调用工具
↓
[工具调用] → 搜索、代码执行、数据库查询
↓
[记忆 Memory] → 向量数据库(Chroma, FAISS)
↓
[大模型推理] → LLM 生成最终回答
典型框架:
实践项目:
| 场景 | 工具 |
|---|---|
| Web API | FastAPI + Uvicorn |
| GPU 推理加速 | TensorRT, ONNX Runtime |
| 边缘设备 | TensorFlow Lite, TorchScript |
| 云原生 | KServe, Triton Inference Server |
端到端项目:
正确路径:
常见误区:
| 阶段 | 能力目标 |
|---|---|
| 1. 编程与数据 | 能独立清洗、分析、可视化数据 |
| 2. 机器学习 | 能完成端到端 ML 项目 |
| 3. 深度学习 | 待补充 |
能够训练 CNN/RNN 并调优参数
4. 专长于 CV/NLP
能够复现论文级别的项目
5. 大规模模型应用
能够构建 Agent + 微调 + 部署
6. 工程化能力
能够交付生产级的 AI 系统
后续内容
部分代码已经上传至 Gitee,未来会逐步更新,主要受限于时间原因。当然,你也可以克隆到本地进行学习和扩展。
祝你编程愉快,早日成为 Python 高手!?????
资料关注
公众号:咚咚王
Gitee:https://gitee.com/wy18585051844/ai_learning
┌───────────────────────────────┐
│ 应用层(智能体 / Agent) │ ← 用户交互、业务场景(如客服机器人、文生图)
├───────────────────────────────┤
│ 编排层(LangChain / MCP / Workflow) │ ← 串联模型、工具、记忆、决策逻辑
├───────────────────────────────┤
│ 大模型层(LLM / Multimodal) │ ← GPT、LLaMA、Stable Diffusion、CLIP、ViT
├───────────────────────────────┤
│ 深度学习框架(PyTorch / TensorFlow) │ ← 构建神经网络、训练/推理
├───────────────────────────────┤
│ 机器学习库(scikit-learn) │ ← 经典 ML 算法快速验证
├───────────────────────────────┤
│ 数据处理与可视化(pandas / numpy / matplotlib)│ ← 数据清洗、探索、转换
├───────────────────────────────┤
│ Python 编程基础 │ ← 语法、函数、面向对象、调试
└───────────────────────────────┘
扫码加好友,拉您进群



收藏
