当前位置: 首页 > news >正文

win10 A4000 下使用Xinference来进行大模型的推理测试

创建环境
conda remove --name xinference --all
conda create --name xinference python=3.10
conda activate xinference
安装:
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

pip install tiktoken sentence-transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install “xinference[transformers]” -i https://pypi.tuna.tsinghua.edu.cn/simple
xinference-local
测试:
进入 http://127.0.0.1:9997
安装EMBEDDING model:bge-large-zh-v1.5 参数:
Replica:1
Device:GPU

安装Language Model:qwen1.5-chat 参数:
Model Engine:Transformers
Model Format:pytorch
Model_size:1.5
Quantization:none
N-GPU:auto
Replica:1
启动模型
即可尝试http://127.0.0.1:9997/qwen1.5-chat/中测试了

可以通过Register Model来注册本地模型。

http://www.lryc.cn/news/398911.html

相关文章:

  • 【9-2:代码规范】
  • std::filesystem::current_path().generic_string()的bug
  • Python excel知识库批量模糊匹配的3种方法实例(fuzzywuzzy\Gensim)
  • stm32使用单通道规则组ADC
  • [python][whl]causal-conv1d的python模块在windows上whl文件下载
  • 介绍 CM3leon,一个更高效、最先进的文本和图像生成模型
  • HTTPS和HTTP有哪些区别
  • Docker 安装 PostgreSQL
  • 实践致知第12享:如何新建一个Word并设置格式
  • Rust vs Go: 特点与应用场景分析
  • 2024的开放式耳机排行榜,看这六个耳机选购的小Tips
  • JAVA-报表模糊搜索询易实现
  • 牛客 7.13 月赛(留 C逆元)
  • FPGA之术语
  • WPF透明置顶窗口wine适配穿透问题解决
  • 浅析Kafka Streams中KTable.aggregate()方法的使用
  • java word转pdf、word中关键字位置插入图片 工具类
  • jail内部ubuntu apt升级失败问题解决
  • 迎接AI新时代:GPT-5的技术飞跃与未来展望
  • Snap Video:用于文本到视频合成的扩展时空变换器
  • 实验8 视图创建与管理实验
  • C++ 开源库
  • LabVIEW滤波器性能研究
  • 『C++成长记』vector模拟实现
  • 【Mac】Charles for Mac(HTTP协议抓包工具)及同类型软件介绍
  • LVS集群及其它的NAT模式
  • 【RNN练习】天气预测
  • prompt第四讲-fewshot
  • StarRocks分布式元数据源码解析
  • 阅读笔记——《Fuzz4All: Universal Fuzzing with Large Language Models》