当前位置: 首页 > news >正文

关于Xinference 中部署服务不能成功的若干问题整理(持续迭代)

背景:

能够成功部署安装并在浏览器访问Xinference,但在部署模型中容易报各种错误,导致莫名的是吧,又不懂如何修复

问题

部署rerank model 模型时报错

Due to a serious vulnerability issue in `torch.load`, even with `weights_only=True`, we now require users to upgrade torch to at least v2.6 in order to use the function. This version restriction does not apply when loading files with safetensors.

解决方案: 

思路:

PyTorch 2.6.0版本针对torch.load函数的安全漏洞进行了强制修复,要求用户必须升级至v2.6及以上版本才能使用该功能。该漏洞涉及反序列化安全问题,即使设置了weights_only=True参数仍存在风险,因此新版通过版本限制强制修复了此问题 。

操作:

1、报错信息截图

2、查看当前pytorch 版本,执行下面命令“python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())",可见刚好处于有问题的2.5.x系列。

3、通过命令“pip uninstall torch torchvision torchaudio” 下载当前的2.5.x

4、通过命令“”查看是否成功卸载pytorch,如下截图表示卸载成功。

5、卸载完成后我们需要下载与自己环境适配的2.6.x 以上版本,访问https://pytorch.org/get-started/locally/ https://pytorch.org/get-started/locally/

2、根据上面网站的配置结合自己的服务配置选择后复制“Run this Command”中的命令在Anaconda Prompt 环境对话框中执行

3、安装完成后使用命令“python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())” 查看版本,如果有版本号出现并且有一个“True”那么证明当前版本可以完美适配你电脑中的显卡(切记本文是英伟达显卡)

4、执行命令“xinference-local --host 127.0.0.1 --port 9997” 重新启动xinference 进行服务安装

5、在网页端进行重新部署应该能够成功

 

http://www.lryc.cn/news/582284.html

相关文章:

  • 安卓10.0系统修改定制化_____安卓9与安卓10系统文件差异 有关定制选项修改差异
  • NLP:文本特征处理和回译数据增强法
  • uniapp三步完成生成一维码图片
  • C#和SQL Server连接常用通讯方式
  • 基于4.14 kernel ARM V7 单核cpu swi功能的验证方法
  • kong网关基于header分流灰度发布
  • 揭秘图像LLM:从像素到语言的智能转换
  • ClickHouse 入门详解:它到底是什么、优缺点、和主流数据库对比、适合哪些场景?
  • 【K线训练软件研发历程】【日常记录向】1.K线滑动窗口
  • 【数据结构】第七弹——Priority Queue
  • Kafka 消费者组再平衡优化实践指南
  • 赛事开启|第三届视觉语音识别挑战赛 CNVSRC 2025 启动
  • RedisTemplate在Spring Boot中的五种数据结构全面详解
  • 电脑电压过高的影响与风险分析
  • 【Java安全】反射基础
  • ARMv7单核CPU上SWI(软件中断)验证
  • 前端面试专栏-算法篇:20. 贪心算法与动态规划入门
  • SQL Server表分区技术详解
  • 瑞斯拜考研词汇课笔记
  • 基于Java+SpringBoot 的销售项目流程化管理系统
  • 深度学习机器学习比较
  • 【ROS2 自动驾驶学习】02-安装ROS2及其配套工具
  • Java 内存分析工具 Arthas
  • 卷积神经网络:卷积层的核心原理与机制
  • MATLAB | 绘图复刻(二十一)| 扇形热图+小提琴图
  • Spring AOP 设计解密:代理对象生成、拦截器链调度与注解适配全流程源码解析
  • 网络安全之重放攻击:原理、危害与防御之道
  • 指尖上的魔法:优雅高效的Linux命令手册
  • Spring Boot 操作 Redis 时 KeySerializer 和 HashKeySerializer 有什么区别?
  • 自动驾驶基本结构与组成