当前位置: 首页 > news >正文

一、大模型推理

https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/README_zh.md

  • 安装 v7.1

https://github.com/hiyouga/LLaMA-Factory/releases/tag/v0.7.1

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]
  • 推理
    • 以 Llama-3-8B-Instruct 为例,这里全部用 vllm 作为后端,不写就是 transformers 后端
  • 使用命令行接口
    • llama3_vllm.yaml
model_name_or_path: eta-Llama-3-8B-Instruct
template: llama3
infer_backend: vllm
vllm_enforce_eager: true
CUDA_VISIBLE_DEVICES=0 llamafactory-cli chat examples/inference/llama3_vllm.yaml

image.png

  • 使用浏览器界面
CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat examples/inference/llama3_vllm.yaml

image.png

  • 启动 OpenAI 风格 API
CUDA_VISIBLE_DEVICES=0 llamafactory-cli api examples/inference/llama3_vllm.yaml

image.png

  • 模拟发起请求
curl http://0.0.0.0:8000/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer " \-d '{"model": "Meta-Llama-3-8B-Instruct","messages": [{"role": "system","content": "You are a helpful assistant."},{"role": "user","content": "Who won the world series in 2020?"},{"role": "assistant","content": "The Los Angeles Dodgers won the World Series in 2020."},{"role": "user","content": "Where was it played?"}]}'

http://www.lryc.cn/news/359804.html

相关文章:

  • .NET IoC 容器(三)Autofac
  • Day44 动态规划part04
  • html期末复习速览
  • CTFHUB-信息泄露-目录遍历和PHPINFO
  • 面向Java程序员的Go工程开发入门流程
  • vue3开发高德地图
  • 通过DLL方式链接glfw3.dll
  • Python自然语言处理(NLP)库之NLTK使用详解
  • sqoop操作
  • 【Qt秘籍】[002]-开始你的Qt之旅-下载
  • 【自动驾驶】点与向量从ego系转odometry系
  • jsmug:一个针对JSON Smuggling技术的测试PoC环境
  • Qt 控件提升
  • 封装一个websocket,支持断网重连、心跳检测,拿来开箱即用
  • 推荐一款开源电子签章/电子合同系统
  • Qt Creator(Qt 6.6)拷贝一行
  • 红队内网攻防渗透:内网渗透之数据库权限提升技术
  • 从0开始制作微信小程序
  • Linux学习笔记:日志文件的编写
  • 为什么要保持方差为1
  • Wpf 使用 Prism 实战开发Day31
  • Linux权限提升二
  • [AI OpenAI] 推出ChatGPT Edu
  • HTML5+CSS3回顾总结
  • AI推介-多模态视觉语言模型VLMs论文速览(arXiv方向):2024.05.01-2024.05.10
  • Python 点云生成高程模型图(DSM)
  • [第五空间 2021]WebFTP
  • SQL—DQL(数据查询语言)之小结
  • 找回xmind文件办法:一切意外均可找回(误删/重启关机等)
  • 微信小程序 npm构建+vant-weaap安装