当前位置: 首页 > news >正文

Elastic Cloud 将 Elasticsearch 向量数据库优化配置文件添加到 Microsoft Azure

作者:来自 Elastic  Serena Chou, Jeff Vestal, Yuvraj Gupta

今天,我们很高兴地宣布,我们的 Elastic Cloud Vector Search 优化硬件配置文件现已可供 Elastic Cloud on Microsoft Azure 用户使用。 此硬件配置文件针对使用 Elasticsearch 作为向量数据库来存储密集或稀疏嵌入的应用程序进行了优化,以用于由 RAG(检索增强生成)支持的搜索和生成 AI 用例。

向量搜索优化的硬件配置文件:你需要了解的内容

Elastic Cloud 用户受益于跨所有主要云提供商(Azure、GCP 和 AWS)的 Elastic 托管基础设施以及对 Microsoft Azure 用户的广泛区域支持。 此版本是继之前发布的针对 GCP 的向量搜索优化硬件配置文件之后发布的。 自 2023 年 11 月起,AWS 用户就可以访问向量搜索优化配置文件。有关此 Azure 硬件配置文件的实例配置的更多具体详细信息,请参阅我们的实例类型文档:azure.es.datahot.lsv3

向量搜索、HNSW 和内存

Elasticsearch 使用分层可导航小世界图 (Hierarchical Navigable Small World ,HNSW) 数据结构来实现其近似最近邻搜索 (ANN)。 由于其分层方法,HNSW 的分层方面提供了出色的查询延迟。 为了获得最佳性能,HNSW 要求将向量缓存在节点的内存中。 此缓存是自动完成的,并使用 Elasticsearch JVM 未占用的可用 RAM。 因此,内存优化是可扩展性的重要步骤。

请参阅我们的向量搜索调整指南,以确定向量搜索嵌入的正确设置以及你是否有足够的内存用于部署。

考虑到这一点,向量搜索优化的硬件配置文件配置为小于标准 Elasticsearch JVM 堆设置。 这为在节点上缓存向量提供了更多的 RAM,从而允许用户为其向量搜索用例配置更少的节点。

如果你使用标量量化等压缩技术,则内存要求会降低 4 倍。要存储量化嵌入(在 Elasticsearch 8.12 及更高版本中提供),只需确保你存储在正确的 element_type: byte 中即可。 要使用 float 向量的自动量化,请更新嵌入以使用索引类型:int8_hnsw,如以下映射示例所示。

PUT my-byte-quantized-index
{"mappings": {"properties": {"my_vector": {"type": "dense_vector","dims": 512,"index_options": {"type": "int8_hnsw"}}}}
}

在即将推出的版本中,Elasticsearch 将提供此作为默认映射,从而无需用户调整其映射。 为了进一步阅读,我们在本博客中提供了 Elasticsearch 中标量量化的评估。

将这种优化的硬件配置文件与 Elasticsearch 的自动量化相结合是两个例子,其中 Elastic 专注于矢量搜索,而我们的矢量数据库既具有成本效益,同时仍然具有极高的性能。

入门

在 Elastic Cloud 上开始免费试用,只需选择新的向量搜索优化配置文件即可开始。

迁移现有 Elastic Cloud 部署

只需点击几下鼠标即可迁移到这个新的向量搜索优化硬件配置文件。 只需导航到你的 Elastic Cloud 管理 UI,单击即可管理特定部署,然后编辑硬件配置文件。 在此示例中,我们将从 “Storage optimized” 配置文件迁移到新的 “Vector Search” 优化配置文件。 当选择这样做时,可用存储会略有减少,但获得的是以较低的成本通过向量搜索在每个内存中存储更多向量的能力。

迁移到新的硬件配置文件使用增长和收缩方法来部署更改。 此方法添加新实例,将数据从旧实例迁移到新实例,然后通过删除旧实例来缩减部署。 即使对于单个可用性区域,此方法也可以在配置更改期间实现高可用性。

下图显示了在 Elastic Cloud 中运行的部署的典型架构,其中向量搜索将是主要用例。

此示例部署使用我们新的向量搜索优化硬件配置文件,现已在 Azure 中提供。 此设置包括:

  • 我们的热层中的两个数据节点以及我们的向量搜索配置文件
  • 1 个 Kibana 节点
  • 一个机器学习节点
  • 一台集成服务器
  • 一个 master tiebreaker

通过使用向量搜索优化的硬件配置文件部署这两个 “全尺寸” 数据节点,同时利用 Elastic 的自动密集向量标量量化,你可以索引大约 6000 万个向量,包括一个副本(具有 768 个维度)。

原文:Elastic Cloud adds Elasticsearch Vector Database optimized profile to Microsoft Azure — Elastic Search Labs

http://www.lryc.cn/news/354466.html

相关文章:

  • Mongodb 可视化工具Robot 3t安装【windows环境下】
  • 【MATLAB】信号的熵
  • 【QT环境配置】节约msvc2017灰色不可用问题
  • MyBatis框架的使用:mybatis介绍+环境搭建+基础sql的使用+如何使用Map传入多个参数+返回多个实体用List或者Map接收+特殊sql的使用
  • linux centos nginx配置浏览器访问后端(tomcat日志)
  • 01-03.Vue:v-on的事件修饰符
  • MSI U盘重装系统
  • ubuntu如何安装gitlab runner
  • Java整合ELK实现日志收集 之 Elasticsearch、Logstash、Kibana
  • 如何判断自己的情商高低?
  • JAVA:Spring Boot整合MyBatis Plus持久层
  • 如何选择优质的气膜体育馆工程服务商—轻空间
  • Anti Desgin Vue 实现 表格可编辑、新增、删除功能
  • 黄金这轮回调会有多深?
  • 自定义类型:结构体详解
  • 嵌入式进阶——舵机控制PWM
  • Java实现抢红包算法——详细注释,标准语法
  • 【优选算法】位运算 {位运算符及其优先级;位运算的应用:判断位,打开位,关闭位,转置位,位图,get lowbit,close lowbit;相关编程题解析}
  • 服务器数据恢复—服务器正常断电重启后raid信息丢失的数据恢复案例
  • 如何理解kmp的套娃式算法啊?
  • python中树的运用样例
  • C++学习/复习5--构造函数与初始化/static成员/友元/内部类/匿名对象/编译器的拷贝构造优化
  • 数学建模--LaTeX基本介绍和入门
  • 【Java面试】二、Redis篇(中)
  • 二进制安装Kubernetes(k8s)v1.30.1
  • 俄罗斯半导体领域迈出坚实步伐:首台光刻机诞生,目标直指7纳米工艺
  • 什么是容器:从基础到进阶的全面介绍
  • 力扣 第 399 场周赛 解题报告 | 珂学家 | 调和级数 + 分块DP
  • Redis的下载、安装、启动和初尝试【超级简单】
  • v-cloak 用于在 Vue 实例渲染完成之前隐藏绑定的元素