当前位置: 首页 > news >正文

【llm 部署运行videochat--完整教程】

# 申请llama权重
https://ai.meta.com/resources/models-and-libraries/llama-downloads/
-> 勾选三个模型
-> 等待接收右键信息


# 下载llama代码库
git clone https://github.com/facebookresearch/llama.git
cd llama
bash download.py
    -> email -> url
    -> 7B, 13B


# 获取转换文件
https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

https://huggingface.co/CarperAI/stable-vicuna-13b-delta/raw/main/apply_delta.py


# 获取videochat
git clone https://github.com/OpenGVLab/Ask-Anything.git
cd Ask-Anything/video_chat/
pip install -r requirements.txt
pip install huggingface_hub


# 下载eva_vit_g.pth
wget https://storage.googleapis.com/sfr-vision-language-research/LAVIS/models/BLIP2/eva_vit_g.pth

# 下载blip2_pretrained_flant5xxl.pth
wget https://storage.googleapis.com/sfr-vision-language-research/LAVIS/models/BLIP2/blip2_pretrained_flant5xxl.pth

## 使用13b模型  运行下边的四个

# 下载stable-vicuna-13b-delta
huggingface-cli download --token hf_xxx --resume-download --local-dir-use-symlinks False CarperAI/stable-vicuna-13b-delta --local-dir stable-vicuna-13b-delta

# 转换权重llama2-13b
python convert_llama_weights_to_hf.py --input_dir llama-2-13b --model_size 13B --output_dir llama2-13b

# 转换权重stable-vicuna-13b
python3 apply_delta.py --base llama2-13b --target stable-vicuna-13b --delta stable-vicuna-13b-delta

# 删除无用的内容
rm -rf stable-vicuna-13b-delta
rm -rf llama-2-13b


## 使用7b模型

# 下载lmsys/vicuna-7b-delta-v0
huggingface-cli download --token hf_xxx --resume-download --local-dir-use-symlinks False lmsys/vicuna-7b-delta-v0 --local-dir vicuna-7b-delta-v0

# 转换权重llama2-7b
python convert_llama_weights_to_hf.py --input_dir llama-2-7b --model_size 7B --output_dir llama2-7b

# 转换权重vicuna-7b-v0
python3 apply_delta.py --base llama2-7b --target vicuna-7b-v0 --delta vicuna-7b-delta-v0

# 删除无用的
rm -rf vicuna-7b-delta-v0
rm -rf llama-2-7b


# 运行
python demo.py

http://www.lryc.cn/news/277959.html

相关文章:

  • Talking about likes
  • DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2
  • 代码随想录算法训练营第二十一天| 回溯 216. 组合总和 III 17. 电话号码的字母组合
  • 微服务架构最佳实践
  • 国内首款支持苹果Find My芯片-伦茨科技ST17H6x
  • linux 01 centos镜像下载,服务器,vmware模拟服务器
  • Linux安装RabbitMq明白纸(无图)
  • Android - CrashHandler 全局异常捕获器
  • 商品源数据如何采集,您知道吗?
  • 输入输出流、字符字节流、NIO
  • js中对数字,超大金额(千位符,小数点)格式化处理
  • Android 打开热点2.4G系统重启解决
  • 全链路压力测试有哪些主要作用
  • 【python基础教程】print输出函数和range()函数的正确使用方式
  • LeetCode255.用队列实现栈
  • PHPStudy快速搭建网站并结合内网穿透远程访问本地站点
  • AI嵌入式K210项目(1)-芯片开发板介绍
  • Blazor中使用impress.js
  • ros2 ubuntu 20.04 安装 foxy
  • Blazor 错误笔记
  • 【深度学习1对1指导】
  • XUbuntu22.04之快速复制绝对路径(二百零五)
  • 21、Kubernetes核心技术 - 高可用集群搭建(kubeadm+keepalived+haproxy)
  • 使用SpringDataRedis操作Redis
  • PyCharm社区版如何创建Django项目并运行
  • 深度探讨鸿蒙工程师面试题
  • python数据结构堆栈
  • 从网页连接socket服务器和I/O
  • 鸿蒙HarmonyOS学习手册_入门篇
  • 人工智能复习