当前位置: 首页 > news >正文

本地部署 CogVLM

本地部署 CogVLM

  • CogVLM 是什么
  • CogVLM Github 地址
  • 部署 CogVLM
  • 启动 CogVLM

CogVLM 是什么

  • CogVLM 是一个强大的开源视觉语言模型(VLM)。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。

  • CogVLM-17B 在 10 个经典跨模态基准测试上取得了 SOTA 性能,包括 NoCaps、Flicker30k captioning、RefCOCO、RefCOCO+、RefCOCOg、Visual7W、GQA、ScienceQA、VizWiz VQA 和 TDIUC,而在 VQAv2、OKVQA、TextVQA、COCO captioning 等方面则排名第二,超越或与 PaLI-X 55B 持平。

CogVLM Github 地址

https://github.com/THUDM/CogVLM.git

部署 CogVLM

克隆代码,

git clone https://github.com/THUDM/CogVLM.git; cd CogVLM

创建虚拟环境,

conda create -n cogvlm python=3.11 -y
conda activate cogvlm

安装 PyTorch,

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
conda install -y -c "nvidia/label/cuda-12.1.0" cuda-runtime

安装依赖项,

pip install -r requirements.txt
python -m spacy download en_core_web_sm

启动 CogVLM

python web_demo.py --from_pretrained cogvlm-chat --version chat --english --bf16

未完待续!

http://www.lryc.cn/news/220770.html

相关文章:

  • bff层解决了什么痛点
  • 面试经典150题——Day33
  • 再谈Android重要组件——Handler(Native篇)
  • Javaweb之javascript的详细解析
  • Linux常用命令——cd命令
  • VHDL基础知识笔记(1)
  • volatile-日常使用场景
  • 策略模式在数据接收和发送场景的应用
  • 学习LevelDB架构的检索技术
  • Docker Swarm实现容器的复制均衡及动态管理:详细过程版
  • Proteus仿真--1602LCD显示仿手机键盘按键字符(仿真文件+程序)
  • Rust语言和curl库编写程序
  • FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
  • 音视频技术开发周刊 | 318
  • asp.net docker-compose添加sql server
  • uniapp 微信小程序 uni-file-picker上传图片报错 chooseAndUploadFile
  • 《向量数据库指南》——用 Milvus Cloud和 NVIDIA Merlin 搭建高效推荐系统结论
  • 致:CSGO游戏搬砖人的一封信
  • MuLogin浏览器如何在一台设备上安全登录和管理多个LinkedIn账户?
  • STM32_project:led_beep
  • [go 反射] 入门
  • 【计算机网络】数据链路层-MAC和ARP协议
  • 本周三商店更新:多款套装下线,四款升级武器带异色皮肤返厂
  • WindowsServer2019-搭建FTP服务器
  • 国际阿里云服务器买哪种好用点?
  • 2023NOIP A层联测25 总结
  • Thread类的基本操作(JAVA多线程)
  • Redis 的三种部署模式
  • 【ArcGIS Pro二次开发】(73):使用NPOI库操作Excel
  • python获取电脑所连接的wifi密码