当前位置: 首页 > news >正文

docker部署本地词向量模型

开源项目:GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models

1. 下载词向量模型

参考我的另一篇博客:langchain 加载本地词向量模型

2. 部署词向量模型

就三行命令

model=/data/BAAI/bge-m3
volume=/home/project/text_embedding/models
docker run -p 8082:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.5 --model-id $model

会先去下载 docker 镜像,然后运行容器。我这里下载的是 cpu 版本的 docker 镜像,其他硬件环境的 docker 镜像参考:https://huggingface.co/docs/text-embeddings-inference/supported_models

特别要强调的是:model 的路径可不是随便写的。在我的这个例子中,启动 docker 时,映射的路径是$volume:/data,因此 model 的路径必须以/data 开头,不然的话是找不到模型的。

我的模型存放路径:/home/project/text_embedding/models/BAAI/bge-m3,大家可以参考我的路径来调整 model 和 volume 变量的值。

3. 调用词向量模型

使用 REST API 调用,可调用的 API 参考:Text Embeddings Inference API

curl 127.0.0.1:8082/embed \-X POST \-d '{"inputs":"What is Deep Learning?"}' \-H 'Content-Type: application/json'
http://www.lryc.cn/news/410308.html

相关文章:

  • 接口自动化中对于文件上传的处理方法
  • Java高频面试题分享
  • kvm虚拟化平台部署
  • 利用arthas热更新class文件
  • 天机学堂 第四天 高并发优化总结
  • Canva收购Leonardo.ai,增强生成式AI技术能力
  • 前端练习<HtmlCSS>——照片墙(附完整代码及实现效果)
  • PHP基于微信小程序的打车平台-计算机毕业设计源码78689
  • Vue element ui分页组件示例
  • redis存储结构
  • SQL Server 数据误删的恢复
  • 墨烯的C语言技术栈-C语言基础-018
  • C端与B端 - 第一弹 - 理解和区分C端与B端软件开发
  • 穿越多元宇宙的.NET:一场跨平台的星际旅行
  • Python自学第五天
  • Cookie-Monster:一款针对Web浏览器的安全分析与数据提取工具
  • C语言的结构体
  • C语言 写一个函数days,实现某日在本年中是第几天计算。
  • 2-50 基于matlab的遗传模拟退火算法的聚类算法
  • 电脑屏幕录制软件,分享4款(2024最新)
  • 机械学习—零基础学习日志(高数16——函数极限性质)
  • 初识c++——list
  • angular入门基础教程(八)表单之双向绑定
  • 【C++】C++中的find方法介绍
  • JVM—HotSpot虚拟机对象探秘
  • AI测试:人工智能模型的核心测试指标,分类判别、目标检测、图像分割、定量计算分别有哪些指标?
  • 探索LLM世界:新手小白的学习路线图
  • Linux基础命令大全 持续更新中......
  • CPU的起源与发展历程
  • 【C语言】 二叉树创建(结构体,先序遍历,中序遍历,后续遍历)