计算机视觉(CV方向)算法基础
秋招临时抱佛脚之作。大纲由GPT提供,内容由博主整理,每日边学边更新,直到拿到满意的offer为止。
1. 基础模型与架构
LeNet、AlexNet、VGG(经典卷积网络演变)
★★★★☆
ResNet、DenseNet(残差结构与梯度流)
★★★★★
MobileNet、ShuffleNet(轻量化网络)
★★★★☆
EfficientNet(复合缩放理念)
★★★★★
Vision Transformer(ViT、Swin Transformer)
★★★★★
ConvNeXt、MaxViT(CNN+ViT融合架构)
★★★★☆
2. 核心视觉任务
图像分类流程:timm 框架、预训练/微调
★★★★★
目标检测:YOLO 系列、Faster R-CNN、RetinaNet
★★★★★
实例/语义分割:UNet、Mask R-CNN、DeepLab v3
★★★★★
关键点检测与姿态估计(OpenPose、HRNet)
★★★☆☆
图像生成与修复:GAN、Diffusion Model
★★★☆☆
3. 自监督与增强方法
数据增强:Mixup、CutMix、RandAugment、Mosaic
★★★★★
自监督预训练:SimCLR、BYOL、MAE、DINO
★★★★☆
Contrastive Learning 与表征学习
★★★★☆
半监督与伪标签方法
★★★☆☆
4. 评价指标与实用技巧
IoU、mAP、Dice、F1-score、Top-K Accuracy
★★★★★
FPN(特征金字塔)与多尺度特征融合
★★★★☆
Anchor-free 检测思想(CenterNet、YOLOX)
★★★★☆
NMS 与 Soft-NMS、DIoU-NMS
★★★☆☆
部署优化:量化、剪枝、蒸馏在检测/分割中的应用
★★★☆☆