当前位置: 首页 > news >正文

安装milvus以及向量库增删改操作

首先电脑已经安装了docker
windows电脑可下载yml文件
https://github.com/milvus-io/milvus/releases/download/v2.4.6/milvus-standalone-docker-compose.yml
创建milvus文件夹,并在这个目录下创建五个文件夹:conf、db、logs、pic、volumes、wal
在这里插入图片描述

然后在文件夹执行命令

docker compose up -d

安装完成在docker里面启动
在这里插入图片描述
然后下载attu工具
attu工具下载地址
如果是centos服务器的话可以直接用宝塔无脑安装milvus
在这里插入图片描述

插入数据到milvus

from pymilvus import connections
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document
from langchain_community.embeddings import DashScopeEmbeddings
from milvus import default_server# 定义嵌入模型(本地部署的embedding模型)
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')
# 可以用自己本地的embedding模型,也可以用阿里和百度的embedding模型
#hfembedding = DashScopeEmbeddings(model="text-embedding-v2", dashscope_api_key="阿里云的apikei")
documentArray = [Document(page_content="在中国办理身份证的流程如下:准备材料:本人户口簿原件及复印件。原有身份证(如是换领)。如果是首次申领,需要提供监护人的户口簿和身份证。近期一寸免冠彩色照片(部分地区可能现场采集,无需自带)。其他可能需要的证明文件,具体可以咨询当地公安机关。预约:一些地区可能要求先在网上或通过电话预约办理时间。你可以访问当地的公安局官方网站或者使用“交管12123”等官方APP进行预约。前往户籍所在地派出所:携带上述所有材料到户籍所在地的公安分局或派出所的身份信息管理科申请办理。如果你是在异地工作或生活,某些情况下也可以在居住地的指定地点办理。填写表格:到达后,工作人员会给你一份《居民身份证申领登记表》,你需要如实填写个人信息。",metadata={"source": "https://www.baidu.com/","title": "如何办理身份证?","createTime": "2024-12-11 08:47"}),
]# 使用递归字符文本分割器拆分文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=100,  # 设置块大小chunk_overlap=10,  # 设置重叠区域length_function=len
)# 拆分文档
documents = text_splitter.split_documents(documentArray)# 将文档和嵌入一起存入 Milvus 向量库
# db_name选择数据库
# collection_name选择表
vector_db = Milvus.from_documents(collection_name='test',documents=documents,  # 拆分后的文档embedding=embedding,  # 嵌入模型connection_args={"host": "127.0.0.1", "port": default_server.listen_port,"db_name":'test'},  # Milvus 连接参数
)

在milvus中查询

from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')# 设置vector_db 
vector_db = Milvus(collection_name='test',embedding_function=embedding,  # 使用关键字参数传递connection_args={"host": "127.0.0.1", "port": 19530}
)query = "如何办理身份证"
#expr参数可以灵活设置条件
documents_all = vector_db.similarity_search(query,expr = "source == 'https://www.baidu.com/' and title like '%身份证%'")
print(documents_all)
#查询文档pk主键
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")print(listpks)

在milvus中删除数据

from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')# 设置vector_db 
vector_db = Milvus(collection_name='test',embedding_function=embedding,connection_args={"host": "127.0.0.1", "port": 19530}
)
#查询出相关的pks
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")
#根据pks批量删除数据
res = vector_db.delete(listpks)
print(res)
http://www.lryc.cn/news/507718.html

相关文章:

  • 基于Spring Boot的找律师系统
  • Pytorch | 利用NI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击
  • 深度学习实战车辆目标跟踪【bytetrack/deepsort】
  • 【C复习】模拟题题库*3总结
  • 【数据分析】层次贝叶斯
  • Layui table不使用url属性结合laypage组件实现动态分页
  • 【蓝桥杯】43688-《Excel地址问题》
  • 【bodgeito】攻防实战记录
  • Soul Preserver
  • Android 折叠屏问题解决 - 展开或收起页面重建
  • 深入理解 Linux wc 命令
  • 半连接转内连接规则的原理与代码解析 |OceanBase查询优化
  • 多进程、多线程、分布式测试支持-pytest-xdis插件
  • Oracle virTualBox安装window10
  • Python7-数据结构
  • springboot指定ssl版本连接
  • VTK编程指南<十二>:VTK图像数据结构及图像创建与显示
  • EasyGBS国标GB28181平台P2P远程访问故障排查指南:客户端角度的排查思路
  • 打造智慧医院挂号枢纽:SSM 与 Vue 融合的系统设计与实施
  • 网络编程 02:IP 地址,IP 地址的作用、分类,通过 Java 实现 IP 地址的信息获取
  • 如何使用Python WebDriver爬取ChatGPT内容(完整教程)
  • WSL切换默认发行版
  • 全志H618 Android12修改doucmentsui功能菜单项
  • 移动网络(2,3,4,5G)设备TCP通讯调试方法
  • 网络安全概论——入侵检测系统IDS
  • Linux通信System V:消息队列 信号量
  • 计算机网络基础图解
  • TDesign:NavBar 导航栏
  • hive注释comment中文乱码解决
  • 电脑提示ntdll.d缺失是什么原因?不处理的话会怎么样?ntdll.dll文件缺失快速解决方案来啦!