当前位置: 首页 > news >正文

向量数据库

向量数据库可以做哪些事情

  • 存储和索引向量
  • 检索相似向量,还具有过滤功能
  • 自动将文档转变成向量,所以会自动化分词、向量化、索引等操作

目前存在的向量数据库:

名称github开源协议
chromahttps://github.com/chroma-core/chromaApache 2.0
Milvushttps://github.com/milvus-io/milvusApache 2.0
Pinecone未开源/
weaviatehttps://github.com/weaviate/weaviateBSD-3-Clause license
qdranthttps://github.com/qdrant/qdrantApache 2.0
vespahttps://github.com/vespa-engine/vespaApache 2.0
zilliz基于Milvus的商业版向量数据库/

其他跟向量数据库相关,严格来说不算向量数据库

  • Faiss 是一个提供高维向量相似性搜索和聚类的算法库,不算向量数据库,向量数据库的相似性检索可以使用到Faiss中的算法。
  • ScaNN 是google开源的相似向量搜索方法
  • vald 是一个可扩展的向量搜索引擎
  • pgvector 为Postgres 提供向量相似度搜索的库
  • typesense 可替代ElasticSearch, 也有向量搜索功能

对于文本,如何挑选向量类型,可参考比较基准:MTEB: Massive Text Embedding Benchmark


参考资料

  1. https://towardsdatascience.com/milvus-pinecone-vespa-weaviate-vald-gsi-what-unites-these-buzz-words-and-what-makes-each-9c65a3bd0696
  2. https://byby.dev/vector-databases
  3. https://platform.openai.com/docs/guides/embeddings/what-are-embeddings
http://www.lryc.cn/news/90651.html

相关文章:

  • leetcode 11.盛最多水的容器
  • 都说00后已经躺平了,但是有一说一,该卷的还是卷啊。
  • 牛客网刷题学习SQL(二)
  • 深蓝学院 C++笔记 先导篇章 - 绪论
  • R7-19 天梯赛团队总分
  • 使用 Kotlin 的 Opt-in (选择加入)功能注解API提示当前非稳定API
  • webpack配置排除打包
  • HNU-操作系统OS-ucoreLab系列-感悟
  • MySQL运维篇(三)
  • Lecture 2 Text Preprocessing
  • web练习第二周
  • LC-1439. 有序矩阵中的第 k 个最小数组和(二分答案、多路归并)
  • 一文1000字从0到1实现Jenkins+Allure+Pytest的持续集成
  • 给一个有序数组生成平衡搜索二叉树(java)
  • 【JavaSE】Java基础语法(二十二):包装类
  • javascript基础十八:说说你对JavaScript中事件循环的理解​
  • 详解js中的浅拷贝与深拷贝
  • Day9 敏捷测试——敏捷开发的特征、什么是敏捷测试?、极限编程、极限测试
  • k8s 维护node与驱逐pod
  • SouapUI接口测试之创建性能测试
  • springboot整合kafka入门
  • Rust 笔记:Rust 语言中的字符串
  • 华为OD机试真题 Java 实现【将真分数分解为埃及分数】【牛客练习题】
  • Zemax Lumerical | 二维光栅出瞳扩展系统优化
  • Linux-0.11 文件系统read_write.c详解
  • 什么是用户态和内核态?用户态切换内核态会有什么影响?
  • 探索iOS之CoreImage框架
  • qml 使用Shape 画图形
  • MySQL数据库修改root账户密码
  • 基于springboot+Vue+ Element-Plus+mysql实现学生宿舍管理系统