当前位置: 首页 > news >正文

戴尔 AI Factory 上的 Agentic RAG 搭载 NVIDIA 和 Elasticsearch 向量数据库

作者:来自 Elastic Hemant Malik, Dell Team

我们很高兴与戴尔合作撰写白皮书《戴尔 AI Factory with NVIDIA 上的 Agentic RAG》。白皮书是一份供开发人员参考的设计文档,概述了实施 Agentic 检索增强生成 (retrieval augmented generation - RAG) 应用程序的策略和解决方案组件。它是跨行业组织(特别是医疗保健行业)使用 AI 驱动的数据检索进行 Agentic RAG 框架决策的设计要点。

什么是戴尔 AI Factory with NVIDIA?

戴尔 AI Factory with NVIDIA 是一款全面的端到端 AI 解决方案,旨在简化和加速各行业企业的 AI 采用。目录产品基于一系列戴尔先进的 PowerEdge 服务器构建,并与 NVIDIA 的 AI 技术配对,提供处理、管理和分析大量数据所需的一切。了解详情。

Elasticsearch 向量数据库

由于组织将内部数据用于情境驱动的生成式 AI (GenAI) 解决方案,因此处理非结构化和半结构化数据并在不牺牲规模的情况下快速检索相关信息仍然具有挑战性。Agentic RAG on Dell AI Factory with NVIDIA 白皮书推荐使用 Elasticsearch 向量数据库进行大规模向量数据索引和检索。

Agentic RAG 堆栈采用 Dell AI Factory 上的 NVIDIA NIM 工具和 Elasticsearch 向量数据库

Elasticsearch 是全球下载次数最多的向量数据库,我们将继续扩大我们的优势。我们最近推出了 Better Binary Quantization (BBQ),它为存储大型向量化数据集带来了显著的速度和效率优势。Elastic 是唯一提供此功能的向量数据库(截至本文发布时)。BBQ 在索引速度(量化时间减少 20 至 30 倍)和查询速度(查询速度提高 2 至 5 倍)方面优于乘积量化 (PQ) 等传统方法,而且准确度没有额外损失。

面向 GenAI 开发人员的更简单、更强大的集成:Elastic AI 生态系统

戴尔 AI Factory 上的 Agentic RAG 和 NVIDIA 概述了开发人员构建真实 RAG 应用程序可能需要的所有解决方案组件 — 涵盖戴尔技术、Elasticsearch 向量数据库、LangChain 的 LangGraph、NVIDIA 推理微服务等。这份白皮书强调了集成良好的 AI 技术生态系统的价值,它可以加速客户开发和部署 RAG 应用程序。

除了与戴尔的合作外,Elastic 还与 LangChain 合作,为 LangGraph 提供了一个检索代理模板(retrieval agent template),该模板已针对 Elasticsearch 向量数据库进行了预配置。通过这样做,我们继续我们的主题,即为开发人员提供更简单、集成良好的生成式 AI 产品。

祝你 AI 代理愉快!

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提及了第三方生成式 AI 工具,这些工具由其各自的所有者拥有和运营。Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害承担任何责任。在使用 AI 工具处理个人、敏感或机密信息时,请谨慎行事。你提交的任何数据都可能用于 AI 培训或其他目的。我们无法保证你提供的信息将得到安全或保密。在使用任何生成式 AI 工具之前,你应该熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关商标是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Agentic RAG on Dell AI Factory with NVIDIA and Elasticsearch Vector Database | Elastic Blog

http://www.lryc.cn/news/490964.html

相关文章:

  • HarmonyOS4+NEXT星河版入门与项目实战(16)------ 状态管理 @State(页面数据刷新与渲染)
  • Origin教程003:数据导入(2)-从文件导入和导入矩阵数据
  • 设计自己的网络通信协议
  • 深入理解 Seata:分布式事务的最佳解决方案
  • JDK下载
  • 如何使用 Python 开发一个简单的文本数据转换为 Excel 工具
  • React(六)——Redux
  • java抽奖系统(二)
  • STM32F10x 定时器
  • 从0开始学PHP面向对象内容之常用设计模式(适配器,桥接,装饰器)
  • 玩转数字与运算:用C语言实现24点游戏的扑克牌魅力
  • 前端入门之VUE--基础与核心
  • logback 初探学习
  • 在Elasticsearch中,是怎么根据一个词找到对应的倒排索引的?
  • 1992-2021年 各省市县经过矫正的夜间灯光数据(GNLD、VIIRS)区域汇总:省份、城市、区县面板数据
  • linux实战-黑链——玄机靶场
  • 鸿蒙NEXT开发案例:字数统计
  • uniapp vue2项目迁移vue3项目
  • 16.C++STL 3(string类的模拟,深浅拷贝问题)
  • 神经网络10-Temporal Fusion Transformer (TFT)
  • “iOS profile文件与私钥证书文件不匹配”总结打ipa包出现的问题
  • 《图像梯度与常见算子全解析:原理、用法及效果展示》
  • 【c++篇】:探索c++中的std::string类--掌握字符串处理的精髓
  • LlamaIndex ollama 搭建本地RAG应用,建立本地知识库
  • draggable的el-dialog实现对话框标题可以选择
  • 2024年Android面试总结
  • 树莓派3:64位系统串口(UART)使用问题的解决方法
  • SemiDrive E3 硬件设计系列---唤醒电路设计
  • 淘宝接口高并发采集核心要点解读,开启电商数据智能应用新纪元
  • C#里怎么样快速使用LINQ实现查询?