【DL学习笔记】DL入门指南
DL入门指南
资料课程
- 李沐老师 《动手学深度学习》
https://tangshusen.me/Dive-into-DL-PyTorch/ - 李宏毅老师课程
https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.php
DL入门必掌握知识点
- 数据处理 : numpy、torch
- 地址处理 : os、pathlib
- 文件处理 : json、yaml
- 命令行参数解析 :args
- 获取时间 : time
- 图片读取与可视化: PIL、cv2、matplotlib
- 数据预处理与数据增强 :torchvision.transforms、cv2
- 获取常用数据/处理数据 :torchvision.datasets、自定义dataset
- 迭代batch数据 : torch.utils.data.DataLoader、自定义collate_fn
- 模型搭建 : torch.nn、torch.nn.functional
- 获取(预训练)模型 :torchvision.models
- 保存日志 :tensorboard、logging
- 优化器 :torch.optim
- 学习率调度器 :torch.optim.lr_scheduler
- 模型参数/checkpoint 保存与加载
- 迁移学习:模型修改、参数冻结
- 各任务常用损失函数
- 各任务评价指标
- 项目环境配置
入门算法
包括但不限于以下算法:
第一阶段 :LeNet、AlexNet、GoogleNet、VGG
第二阶段 :Resnet、DenseNet、Unet、FCN
第三阶段 :Faster RCNN、SSD、YOLO v3、self-attention、Vision Transformer(encoder-decoder模块)
第四阶段 : YOLO 系列 、 DETR 系列、(有兴趣的可以看 Mamba 系列)
入门评估
怎样才算入门?
1、掌握模型训练代码框架
2、熟悉各种常用数据集
3、无障碍预处理数据
4、玩转以 resnet 为 backbone 的各种迁移学习算法
5、熟悉图像分类任务、目标检测任务、语义分割任务的常用损失函数与评价指标
6、完全理解 Fater RCNN、SSD、YOLO v3、Attention 的理论,看懂并理解每一行代码