【2025CVPR-图象分类方向】ProAPO:视觉分类的渐进式自动提示优化
论文地址:https://openaccess.thecvf.com/content/CVPR2025/html/Qu_ProAPO_Progressively_Automatic_Prompt_Optimization_for_Visual_Classification_CVPR_2025_paper.html
研究背景与问题
-
视觉语言模型(VLMs)的局限性
- VLMs(如CLIP)在图像分类中依赖提示(prompt)质量,但现有方法存在缺陷:
- 手工设计模板:需领域专业知识,难以扩展(如“a photo of a {class}”)。
- 提示调优方法:需
- VLMs(如CLIP)在图像分类中依赖提示(prompt)质量,但现有方法存在缺陷: