《动手学深度学习》 是由亚马逊团队(阿斯顿・张、李沐等)联合编写的 开源深度学习教科书,提供 多框架实现(PyTorch/TensorFlow/PaddlePaddle),以 “理论 + 代码 + 实验” 三位一体的方式帮助读者快速掌握深度学习核心技术。
- 预备知识:涵盖线性代数、微积分、概率、自动微分等数学基础,以及数据预处理技术。
- 线性神经网络:线性回归、softmax 回归的原理与实现。
- 现代网络架构:
- 卷积神经网络(CNN):LeNet、AlexNet、ResNet 等经典模型。
- 循环神经网络(RNN):LSTM、GRU、Transformer 架构。
- 注意力机制:自注意力、多头注意力、BERT 预训练。
- 优化算法:梯度下降、动量法、Adam 等优化策略。
- 计算机视觉:目标检测(SSD/R-CNN)、语义分割、风格迁移。
- 自然语言处理:词嵌入(word2vec/GloVe)、序列到序列模型、BERT 实战。
- 分布式训练:多 GPU/TPU 加速、参数服务器。
- Kaggle 竞赛:房价预测、CIFAR-10 图像分类、狗品种识别等。
- 行业应用:推荐系统、情感分析、机器翻译等。
-
多框架支持
- 同一算法提供 PyTorch、TensorFlow、PaddlePaddle 三种实现,适配不同技术栈。
- 代码示例模块化,便于快速迁移至其他框架。
-
交互式学习体验
- 集成 Jupyter Notebook,支持在线运行代码(通过 Google Colab 或 B 站镜像)。
- 实时修改超参数(如学习率、层数),观察训练效果变化。
-
社区驱动开发
- 全球 200 + 贡献者参与内容更新,确保技术前沿性(如 2023 年新增 Transformer 章节)。
- 讨论区提供竞赛经验分享与模型优化技巧。
人群 |
适用场景 |
在校学生 |
课程教材(如斯坦福、MIT 等高校选用),配套实验作业与考试题库。 |
AI 从业者 |
查漏补缺(如梯度消失、模型初始化),学习工业级项目实战(如医疗影像分析)。 |
研究人员 |
复现经典论文(如 ResNet、BERT),理解模型改进思路。 |
跨领域学习者 |
通过 Python 代码快速上手深度学习,无需数学推导门槛。 |
-
基础入门:
- 第 1-4 章(线性模型、MLP) → 掌握损失函数、优化器等核心概念。
- 完成 “房价预测” Kaggle 竞赛,实践数据预处理与模型训练流程。
-
进阶提升:
- 第 6-10 章(CNN/RNN/ 注意力) → 复现 CIFAR-10 分类任务。
- 学习第 14 章(BERT 预训练),参与 “情感分析” 实战项目。
-
研究 / 工程导向:
- 第 13 章(目标检测)+ 第 15 章(NLP 应用) → 构建完整 CV/NLP pipeline。
- 探索附录中的多 GPU 训练与模型部署技巧。
维度 |
《动手学深度学习》 |
传统教科书(如《深度学习》花书) |
在线课程(如 Coursera 专项课) |
实践性 |
代码可直接运行,强调动手实验 |
理论推导为主,缺乏代码示例 |
视频讲解 + 作业,代码需手动实现 |
框架覆盖 |
多框架实现(PyTorch/TensorFlow) |
无框架绑定,伪代码为主 |
单一框架(如 PyTorch) |
社区支持 |
活跃开源社区,持续更新 |
出版后内容固定 |
官方论坛答疑,更新周期较长 |