当前位置: 首页 > news >正文

数据库管理-第152期 Oracle Vector DB AI-04(20240220)

数据库管理152期 2024-02-20

  • 数据库管理-第152期 Oracle Vector DB & AI-04(20240220)
    • 1 常用的向量检索方法
      • 聚类
      • 图搜索
      • 哈希
      • 量化
    • 2 Oracle Vector DB中的索引
      • 索引(默认)
    • 索引(高级)
    • 3 EMBEDDINGS
      • SQL EMBEDDINGS 函数
      • OONX
    • 总结

数据库管理-第152期 Oracle Vector DB & AI-04(20240220)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Associate: Database(Oracle与MySQL)
网思科技 DBA总监
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家,ITPUB认证专家,OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭。

由于上一篇的一些“误操作”,导致公众号发文删了,当天重发没有办法触发群发效果,所以可能有些人会发现没看过03。

1 常用的向量检索方法

聚类

K-Means 和 Faiss
image.png

图搜索

Hierarchical Navigable Small Worlds (HNSW)
image.png

哈希

局部敏感哈希(Locality Sensitive Hashing)LSH

量化

Product Quantization (PQ):有损压缩

2 Oracle Vector DB中的索引

在Oracle Vector DB中,可以在Vector数据类型列上创建vector index来提升向量检索的性能:

索引(默认)

create vector index vector_idx on vector_table (data_vector)
organization [inmemory neighbor graph | neighbor partition]

距离计算:欧几里德
向量索引的选择取决于organization子句:

  1. In-Memory Neighbor Graph organization:HNSW
  2. Neighbor Partition organization:IVF

索引(高级)

可以指定向量索引类型参数、距离函数、精度等:

create vector index vector_idx on vector_table (data_vector) organization neighbor partition parameters (num_centroids 1024);

3 EMBEDDINGS

在Oracle Vector DB除直接通过外部导入向量外,也内建支持多种向量生产方式:

SQL EMBEDDINGS 函数

原生支持生成向量数据:

select id, image from cat_images order by VECTOR_DISTANCE(img_vec, EMBEDDING(resnet_50 USING :input_img)) fetch first 2 rows only;

image.png

OONX

Open Neural Network eXchange embedding 模型:

DECLAREmodel_source BLOB := NULL;
BEGINmodel_source :=DBMS_CLOUD.get_object( credential_name =>'OBJ_STORE_CRED',object_uri	=> 'https://objectstorage…bucketname/o/resnet50bundle.onnx’);DBMS_DATA_MINING.import_onnx_model( model_name	=> "resnet50",model_data	=> model_source,metadata		=> JSON('{ function : "embedding" }')
);
END;

总结

本期简单讲解了一下,Oracle Vector索引以及内建向量EMBEDDING能力。
老规矩,知道写了些啥。

http://www.lryc.cn/news/303219.html

相关文章:

  • uniapp app端水印组件封装 一次引入版
  • 最新Unity游戏主程进阶学习大纲(2个月)
  • NoSQL 数据库管理工具,搭载强大支持:Redis、Memcached、SSDB、LevelDB、RocksDB,为您的数据存储提供无与伦比的灵活性与性能!
  • 基于Spring Boot的多级缓存系统设计
  • k8s-配置与存储-配置管理
  • c语言实现bellman-ford算法
  • socket与rpc的区别
  • 10、内网安全-横向移动域控提权NetLogonADCSPACKDC永恒之蓝
  • 代码随想录算法训练营第三八天 | 动态规划
  • 【ubuntu2004安装N卡驱动】
  • 使用 Docker 安装 Kibana 8.4.3
  • 基于python社交网络大数据分析系统的设计与实现
  • 【设计模式】23种设计模式笔记
  • 编程笔记 Golang基础 009 标识符和关键字
  • vue3中mockjs模拟获取数据
  • element ui 添加自定义方法
  • Hive UDF
  • python Opencv 中绘制图
  • imazing软件安全吗?2024中文永久免费许可证
  • JavaScript:防抖与节流
  • 在Win系统部署WampServer并实现公网访问本地服务【内网穿透】
  • 面试经典150题——单词规律
  • RK3568平台开发系列讲解(Linux系统篇)container_of
  • 回显服务器
  • c#,dotnet, DataMatrix 类型二维码深度识别,OCR,(基于 Halcon)
  • 亿道丨三防平板电脑厂商哪家好丨麒麟系统三防平板PAD
  • 什么是hash冲突?以及解决方案
  • C# CAD交互界面-模态窗体与非模态窗体调用方式
  • 19个Web前端交互式3D JavaScript框架和库
  • PaddleSeg分割框架解读[01] 核心设计解析