当前位置: 首页 > news >正文

vllm部署记录

1. pip安装

pip install vllm

下载模型在huggingface.co

注意在modelscope上的这个opt-125m好像不行了,我git不下来报错

启动服务

vllm serve opt-125m --model opt-125m --port 8888

第一个opt-125m是名字,可以在vllm支持的模型中查到,第二个是模型存放文件夹及其路径
也可以

python -m vllm.entrypoints.openai.api_server --model=opt-125m --port 8888

客户端

curl http://localhost:8888/v1/completions \-H "Content-Type: application/json" \-d '{"model": "opt-125m","prompt": "San Francisco is a","max_tokens": 7,"temperature": 0}'

或者从

git clone https://www.modelscope.cn/OpenBMB/miniCPM-bf16.git

然后启动

python -m vllm.entrypoints.openai.api_server --model=miniCPM-bf16 --port 8888 --trust-remote-code

客户端

curl http://localhos
http://www.lryc.cn/news/408806.html

相关文章:

  • HTML前端 盒模型及常见的布局 流式布局 弹性布局 网格布局
  • 网络安全 DVWA通关指南 DVWA Command Injection(命令注入)
  • VUE3学习第三篇:报错记录
  • CentOS怎么关闭自动锁屏?
  • vscode 环境
  • 浏览器自动化测试工具selenium——爬虫操作记录
  • 微信小程序配置访问服务器失败所发现的问题及解决方案
  • javaEE(1)
  • 极简Springboot+Mybatis-Plus+Vue零基础萌新都看得懂的分页查询(富含前后端项目案例)
  • IPython的Bash之舞:%%bash命令全解析
  • ST Stellar-E SR5E1 22KW OBC combo 3KW DC-DC汽车充电器解决方案
  • Postman中的A/B测试实践:优化API性能的科学方法
  • 微信小程序支付流程
  • Istio 学习笔记
  • 测试面试宝典(三十三)—— 接口测试有没有测试出什么问题?
  • YOLOV8模型转TFJS 在Mac下遇到的版本的坑
  • vue、react前端框架实现TodoList页面案例
  • el-date-picker 时间控件校验选择时间必须早于当前时间(带时分秒)
  • godot新建项目及设置外部编辑器为vscode
  • vue中无法调试
  • python机器学习8--自然语言处理(2)
  • LinkedList底层原理
  • CSS技巧专栏:一日一例 11 -纯CSS实现多彩渐变按钮系列特效
  • 基于微信小程序+SpringBoot+Vue的自助点餐系统(带1w+文档)
  • 04-Charles中的Map Remote和Map Local介绍
  • R语言优雅的进行广义可加模型泊松回归分析
  • 大模型学习笔记十四:Agent模型微调
  • 大疆创新2025校招内推
  • 搜索引擎项目(四)
  • 声音克隆一键本地化部署 GPT-SoVITS