当前位置: 首页 > news >正文

MySQL 9.0新特性:向量存储

MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。

向量类型

MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:

VECTOR(N)

其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。

向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:

CREATE TABLE t(id int, rgb vector(3));INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));

向量函数

MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数。

首先,STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:

SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
------------------------------------------+
6666863F66668EC100000042                  |

STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。

TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。

其次,VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:

SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
-------------------------------------------------------+
[1.05000e+00,-1.78000e+01,3.20000e+01]                 |SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
----------------------------------------------------+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00]   |

输出结果中的浮点数使用科学计数法表示。

FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。

最后,VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:

SELECT VECTOR_DIM(rgb) FROM t;VECTOR_DIM(rgb)|
---------------+3|3|3|

使用限制

VECTOR 数据类型存在以下限制:

  • VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
  • VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
  • VECTOR 类型的字段不能作为直方图的统计源。
  • 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
  • VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
  • VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
  • VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
  • 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
  • VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。

总结

首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。

不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。

http://www.lryc.cn/news/395119.html

相关文章:

  • ruoyi实用性改造--(四)选择数据源及非标准使用数据库
  • HMI 的 UI 风格创造奇迹
  • 如何安全隐藏IP地址,防止网络攻击?
  • Windows10/11家庭版开启Hyper-V虚拟机功能详解
  • 202487读书笔记|《我有个拥抱,你要不要》——生活从来如此,你的态度赋予它意义
  • 使用tcpdump抓取本本机的所有icmp包
  • Nginx:负载均衡小专题
  • 新增多种图表类型,新增插件管理模块,DataEase开源数据可视化分析工具v2.8.0发布
  • android perfetto使用技巧梳理
  • bond网络配置文件中zone
  • spring事务详解
  • LIMS系统的核心功能有哪些
  • jenkins在使用pipeline时,为何没有方块形视图
  • Desktop docker 部署 WordPress
  • 简单的找到自己需要的flutter ui 模板
  • SpringBoot实现多数据源切换
  • VUE + 小程序 关于前端循环上传附件页面卡死的问题
  • 【基础算法总结】分治—归并
  • 基于Java+SpringMvc+Vue技术的实验室管理系统设计与实现(6000字以上论文参考)
  • 19_谷歌GoogLeNet(InceptionV1)深度学习图像分类算法
  • clickhouse高可用可拓展部署
  • QT中QDomDocument读写XML文件
  • sql盲注
  • 星网安全产品线成立 引领卫星互联网解决方案创新
  • Adam自适应动量优化算法
  • Mac OS系统中Beyond Compare 4破解方式
  • 6000元最好的家用投影仪:当贝X5S Pro六千元配置最高画质最强
  • #### golang中【堆】的使用及底层 ####
  • OpenAI Gym Atari on Windows
  • Java进阶----接口interface