当前位置: 首页 > news >正文

EVA-CLIP实战

摘要

EVA-CLIP,这是一种基于对比语言图像预训练(CLIP)技术改进的模型,通过引入新的表示学习、优化和增强技术,显著提高了CLIP的训练效率和效果。EVA-CLIP系列模型在保持较低训练成本的同时,实现了与先前具有相似参数数量的CLIP模型相比更高的性能。特别地,文中提到的EVA-02-CLIP-E/14+模型,使用90亿数据样本和5.0B(50亿)参数,在ImageNet-1K的val数据集上取得了82.0%的零样例一级准确率。而较小的EVA-02-CLIP-L/14+模型,尽管仅使用了4.3亿参数和60亿数据样本,也达到了80.4%的零样例一级准确率。这些结果表明,EVA-CLIP在图像分类任务中,特别是在零次学习(zero-shot learning)场景下,展现出了卓越的性能。

代码链接:https://github.com/baaivision/EVA?tab=readme-ov-file
论文:https://arxiv.org/abs/2303.15389

环境搭建

基础环境

环境:Ubuntu+CUDA12.1+pytorch 2.3.1+python 11。 主要是CUDA,尽量版本高一点,xFormers 的版本不同,对CUDA的版本要求也不同。最新版本已经要求pytorch2.3.0了。

在这里插入图片描述

安装步骤。

http://www.lryc.cn/news/370792.html

相关文章:

  • 限定法术施放目标
  • 【通信原理】数字频带传输系统
  • 数据价值管理-数据验收标准
  • vue3模板语法总结
  • Spring Cloud 之 GateWay
  • 可转债全部历史因子数据,提供api支持
  • Python | C++ | MATLAB | Julia | R 市场流动性数学预期评估量
  • Android 常用开源库 MMKV 源码分析与理解
  • 大模型高级 RAG 检索策略之流程与模块化
  • TCPListen客户端和TCPListen服务器
  • DDei在线设计器-属性编辑器
  • 八字综合测算网整站源码程序/黄历/灵签/排盘/算命/生肖星座/日历网/周公解梦
  • C# WPF入门学习主线篇(十一)—— 布局管理
  • LabVIEW轴承试验机测控系统
  • 0605 实际集成运算放大器的主要参数和对应用电路的影响
  • 艾宾浩斯winform单词系统+mysql
  • rv1126-rv1109-串口显示路径不变化
  • 基于C#开发web网页管理系统模板流程-主界面密码维护功能完善
  • [NOVATEK] NT96580行车记录仪功能学习笔记(持续更新~
  • 力扣752. 打开转盘锁
  • 揭秘:义乌理阳的跨境选品师项目
  • 电视剧推荐
  • ISO 19115-3:2023 关于元数据最小实例的允许命名空间的详细说明
  • 最新下载:CorelDraw 2023【软件附加安装教程】
  • QT系列教程(8) QT 布局学习
  • SpringCloud Gateway中Route Predicate Factories详细说明
  • 计算机视觉全系列实战教程:(八)图像变换-点运算、灰度变换、直方图变换
  • 4.MongoDB sharding Cluster 分片集群
  • PDF转图片工具
  • Day 19:419. 甲板上的战舰