当前位置: 首页 > news >正文

Vector Search with OpenAI Embeddings: Lucene Is All You Need

本文是LLM系列文章,针对《Vector Search with OpenAI Embeddings: Lucene Is All You Need》的翻译。

使用OpenAI嵌入的向量搜索:Lucence是你所需的一切

  • 摘要
  • 1 引言
  • 2 从架构到实现
  • 3 实验
  • 4 讨论
  • 5 结论

摘要

我们在流行的MS MARCO文章排名测试集上使用Lucene提供了一个可复制的、端到端的OpenAI嵌入向量搜索演示。我们工作的主要目标是挑战主流的说法,即专用向量存储是利用深度神经网络应用于搜索的最新进展所必需的。恰恰相反,我们表明Lucene中的分层可导航小世界网络(HNSW)索引足以在标准双编码器架构中提供向量搜索功能。这表明,从简单的成本效益分析来看,似乎没有令人信服的理由将专用向量存储引入现代“人工智能堆栈”中进行搜索,因为这些应用程序已经在现有的、广泛部署的基础设施中获得了大量投资。

1 引言

2 从架构到实现

3 实验

4 讨论

5 结论

毫无疑问,密集向量的操作是当今搜索的重要组成部分。我们要解决的核心争论是如何在生产系统中实施和部署这些功能。主流的说法是,你需要一个新的、独特的添加到你的企业“AI堆栈”中——一个向量存储。我们提出的另一种选择是:如果你已经构建了搜索应用程序,那么你很可能已经投资于Lucene生态系统。在这种情况下,Lucene就是您所需要的全部。当然,时间会告诉我们谁是对的。

http://www.lryc.cn/news/152871.html

相关文章:

  • JS算法与树(二)
  • composer 扩展库。助手库文档
  • Web弹性布局
  • 基于深度学习的AI生成式人脸图像鉴别
  • iOS开发Swift-1-Xcode创建项目
  • AI 领域中 SLAM、Planning 和 Perception 的区别和联系
  • 【数据库】MySQL基础知识全解
  • 【golang】调度系列之goroutine
  • A 股个股资金流 API 数据接口
  • 【前端】Layui动态数据表格拖动排序
  • Linux 忘记密码解决方法
  • 【计算机组成 课程笔记】2.1 设计自己的计算机
  • vb房屋销售管理系统设计与实现
  • SpringCloud学习笔记(十三)_Zipkin使用SpringCloud Stream以及Elasticsearch
  • 重仓“AI”的百度迎来收获季?
  • Linux 通过 Docker 部署 Nacos 2.2.3 服务发现与配置中心
  • macOS上制作arm64的jdk17镜像
  • 对话永洪科技CEO何春涛:专注BI,决胜AI时代丨数据猿专访
  • Redis 数据类型详细解析
  • NOR型flash vs NAND型flash
  • 基于FPGA的图像sobel边缘提取算法开发,包括tb测试文件以及matlab验证代码
  • 设计模式-7--代理模式(Proxy Pattern)
  • 音频——I2S 左对齐模式(三)
  • css-grammar
  • ubuntu创建自定义开机服务
  • Cocos独立游戏开发框架中的日志模块:Bug无所遁形
  • 设计模式行为模式-命令模式
  • Linux-安装redis6.2.1及主备复制模式(replication)
  • 新手做TikTok适合哪些类目?
  • Open3D(C++) 点云格网分块