当前位置: 首页 > article >正文

OceanBase 开发者大会,拥抱 Data*AI 战略,构建 AI 数据底座

5 月 17 号以“当 SQL 遇见 AI”为主题的 OceanBase 开发者大会在广州举行,因为行程的原因未能现场参会,仍然通过视频直播观看了全部的演讲。总体来说,这届大会既有对未来数据库演进方向的展望,也有 OceanBase 新产品的发布,还有当前行业用户使用 OceanBase 数据库的经验分享,可谓是干货满满。

全面拥抱 Data*AI 战略

2025 年可以说是 AI 元年,各大厂商都在积极的将自己的产品纳入到 AI 框架中,OceanBase 也不例外。蚂蚁金服 CTO 何征宇在演讲中指出,AI 的本质仍然是数据,决定了智能的上限。然而当前获取数据的成本越来越高、行业数据流通难、多模态数据处理难以及数据质量评估难等几大问题,制约了 AI 在行业中的落地和推广应用。

OceanBase 的 Data*AI 战略,致力于打造一个数据底座,通过一套架构同时支持 TP/AP/AI 混合负载,既支持向量检索,又能实现 SQL 与 AI 的混合检索,实现数据与模型的深度一体化融合。

积极拓展 AI 数据底座能力

说到 AI 总是离不开向量数据库,当大模型的数据无法触及到更专业更精准的领域时,将专业数据向量化保存到数据库中,是大模型最好的补充。OceanBase 向量数据库经过多个版本的迭代,其处理性能已经超过业界主流开源向量数据库。

和 Data*AI 战略相呼应,本次大会上正式发布 OceanBase PowerRAG,打造面向 AI 时代开箱即用的 RAG 服务。PowerRAG 提供 Document(文档)和 Chat(对话)两个核心 API 接口,打通应用开发数据层、平台层、接口层与应用层的全流程,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种 AI 应用场景的快速开发。

在这里插入图片描述

传统能力持续增强

OceanBase 架构演进上有两个最重要的版本迭代,一是 2016 年 1.0 版本实现了所有节点的可读可写,另一个是 2020 年的 4.0 版本提出的单机分布式一体化架构,能够在一套系统中同时实现分布式的扩展性和单机性能。在夯实了高可用基础,实现稳定的性能之后,OceanBase 也在向更多的领域扩展。

  • 正式推出 OceanBase 企业级单机版,支持非核心的系统更轻量的使用 OceanBase 数据库;桌面版甚至能够在 2C6G 配置的笔记本上运行。相比于集群版动辄几十 G 的内存来说,单机版和桌面版大大降低用户的使用门槛;
  • 全新发布面向对象存储的“共享存储”产品形态,成为业界首个在 TP 场景下支持对象存储的多云原生数据库。成本角度看,在 TP 负载下,存储成本降低 50%;在 AP 负载下,存储成本最高可降低为原来的 1/10。相对于 Share Nothing,在计算节点扩容时不需要进行数据迁移,具有更快的速度和弹性;
  • OceanBase 4.3.5 也是首个面向 AP 场景功能完备的 LTS 版本。针对一系列 AP 数据库的能力进行了增强,如支持堆表组织表,适应 AP 中经常大批量数据导入而数据又无序的场景;增强了嵌套物化视图功能,满足数据加工和预处理的需求;未来还将持续和 Iceberg 等数据湖的集成,通过 OceanBase 访问外部数据会更加便利。

写在最后

经过 10 多年的发展,OceanBase 已经成为最流行的开源中国数据库之一,连续两年占据墨天轮国产数据库排行榜的首位。自 2021 年 6 月 1 号开源以来,已经有超过 1500 个企业用户选择使用 OceanBase,社区集群安装量已经超过 52000 套,而且这个趋势还在不断的加速中。

自笔者开始关注以来,OceanBase 在产品能力和市场拓展上取得了非常大的成就。 在 AI 元年 OceanBase 也适时推出了 Data*AI 的战略,相信在不久的将来也会看到 OceanBase 在 AI 领域更大的成功。

http://www.lryc.cn/news/2382132.html

相关文章:

  • STM32IIC协议基础及Cube配置
  • CNN vs ViT:图像世界的范式演进
  • cocos creator使用jenkins打包微信小游戏,自动上传资源到cdn,windows版运行jenkins
  • 定时器的两种实现方式
  • Python、Pytorch、TensorFlow、Anconda、PySide、Jupyter
  • [Java实战]Spring Boot整合MinIO:分布式文件存储与管理实战(三十)
  • MacBook Air A2179(Intel版)安装macOS Catalina所需时间
  • AI在人力资源领域的应用:把握时代浪潮
  • 【VxWorks 实时操作系统(RTOS)】常用函数汇总
  • vr制作公司提供什么服务?
  • 下一代电子电气架构(EEA)的关键技术
  • matlab慕课学习3.5
  • 大语言模型(LLM)如何通过“思考时间”(即推理时的计算资源)提升推理能力
  • Ollama 如何在显存资源有限的情况下合理分配给不同的服务?
  • Qt音视频开发过程中一个疑难杂症的解决方法/ffmpeg中采集本地音频设备无法触发超时回调
  • 基于注意力机制与iRMB模块的YOLOv11改进模型—高效轻量目标检测新范式
  • PEFT库PromptTuningConfig 配置
  • 操作系统----软考中级软件工程师(自用学习笔记)
  • SQL 多表关联与分组聚合:解密答题正确率分析
  • 基于 Redis 实现短信验证码登录功能的完整方案
  • 电平匹配电路
  • JavaScript 日志和调试工具箱-logger2js
  • GitHub 自动认证教程
  • zData X zStorage 为什么采用全闪存架构而非混闪架构?
  • 鸿蒙OSUniApp 实现精美的轮播图组件#三方框架 #Uniapp
  • 解决git中断显示中文为八进制编码问题
  • SQL次日留存率计算精讲:自连接与多字段去重的深度应用
  • 使用SQLite Studio导出/导入SQL修复损坏的数据库
  • LSTM-Attention混合模型:美债危机与黄金对冲效率研究
  • 了解 DDD 吗?DDD 和 MVC 的区别是什么?