当前位置: 首页 > article >正文

vllm server返回404的一种可能得解决方案

我的 server 启动指令

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7  PYTHONPATH=${PYTHONPATH}:/root/experiments/vllm vllm serve ./models/DeepSeek-V3-awq --tensor-parallel-size 8 --trust-remote-code  --disable-log-requests --load-format dummy --port 8040 

client 端访访问后,server端返回:
在这里插入图片描述
就很奇怪,不都是直接访问 /v1/completions 这个路径吗?咋能404呢?

哦,原来是模型路径填错了

python benchmark_client.py \--backend vllm \--num_prompts 3000 \--warmup_round 1 \--concurrency 256 \--host localhost \--port 8000 \--model_name /test/models/DeepSeek-V3-awq      # <---------

启动server的时候写的是相对路径,这里写成绝对路径了
benchmark_client.py 这里是我的测试脚本,你看看你的请求头里的模型名字/路径改对了吗

http://www.lryc.cn/news/2387622.html

相关文章:

  • kafka之操作示例
  • MySQL问题:MySQL中使用索引一定有效吗?如何排查索引效果
  • OpenSSL 签名验证详解:PKCS7* p7、cafile 与 RSA 验签实现
  • 利用 `ngx_http_xslt_module` 实现 NGINX 的 XML → HTML 转换
  • C语言队列详解
  • Qt中的智能指针
  • 车载网关策略 --- 车载网关通信故障处理机制深度解析
  • 三天掌握PyTorch精髓:从感知机到ResNet的快速进阶方法论
  • Python爬虫实战:研究Selenium框架相关技术
  • 分布式缓存:三万字详解Redis
  • BiLSTM与Transformer:位置编码的隐式vs显式之争
  • html5视频播放器和微信小程序如何实现视频的自动播放功能
  • 【QT】QString和QStringList去掉空格的方法总结
  • 58同城大数据面试题及参考答案
  • 25.5.27学习总结
  • 关于vue结合elementUI输入框回车刷新问题
  • vue项目表格甘特图开发
  • Spark 中,创建 DataFrame 的方式(Scala语言)
  • Python----目标检测(MS COCO数据集)
  • 塔能科技:有哪些国内工业节能标杆案例?
  • 图论:floyed算法
  • 嵌入式系统C语言编程常用设计模式---参数表驱动设计
  • OpenCV CUDA模块图像过滤------创建一个行方向的一维积分(Sum)滤波器函数createRowSumFilter()
  • Frequent values/gcd区间
  • 08SpringBoot高级--自动化配置
  • Deep Evidential Regression
  • 「Python教案」循环语句的使用
  • linux快速入门-VMware安装linux,配置静态ip,使用服务器连接工具连接,快照和克隆以及修改相关配置信息
  • 用户配置文件(Profile)
  • ubuntu 制作 ssl 证书