当前位置: 首页 > news >正文

Text2SQL之Vanna优化

文章目录

  • 前言
  • 一、优化方向
  • 二、干就完了
    • 一次性生成多个Question-SQL对
    • 先生成一个问题,再根据DDL和业务数据生成SQL
  • 总结


前言

前阵子写了篇Text2SQL的简单介绍,发现其也是RAG只会,写下了Text2SQL之不装了,我也是RAG

最近也一直在做Text2SQL的优化,于是把自己的一些心得,总结于这篇文章。

一、优化方向

既然本质是RAG,那顺着RAG的优化方向走,准没错。

  • 文档增强:
    • 对文档进行摘要:先对摘要进行检索,如果有必要,才深入文档细节
    • 对文档进行QA生成:同时检索文档和生成的QA
    • 数据清洗,去除文档中存在的特殊字符或不相关信息
  • 元数据过滤:例如对query和文档分类,对应类别的query只查找对应类别的文档,能有效提升检索效率和召回率
  • 混合检索:语义检索 + 关键词检索
  • query改写:让LLM对query改写,在嵌入空间中,看似相同的两个问题并不一定很相似
    • 同义词替换:例如,将“LLM”、“大语言模型”和“大模型”标准化为通用术语。
    • 缩写替换
  • query分解:将复杂query分解成多个子问题,逐个进行匹配,然后汇总文档,生成答案
  • HyDE: 用LLM直接生成query的回答,将生成的答案与query 拼接,再进行RAG
  • 文档分块优化:
    • 内容重叠分块&
http://www.lryc.cn/news/375098.html

相关文章:

  • 船舶行业信息安全解决方案介绍
  • Typora—适用于 Mac 和 Win 系统的优秀 Markdown 文本编辑器
  • 产品经理的未来在哪里?
  • 火车头采集怎么使用GPT等AI原创文章
  • 多元多项式的特征列与零点的关系定理
  • git - LFS 使用方法
  • 提高磁盘可靠性的技术:保障数据安全的四大方法
  • CesiumJS【Basic】- #006 浏览器控制台查看位置角度
  • Mac 终端报错 zsh: command not found: brew 解决方案
  • 详解 HBase 的常用 API
  • JSR303校验
  • 04 远程访问及控制
  • [晕事]今天做了件晕事38 shell里的source 点号
  • java如何分割字符串
  • 胡说八道(24.6.12)——数字电子技术以及Modelsim
  • 【Android面试八股文】AsyncTask中的任务是串行的还是并行的
  • 无人机RTMP推流EasyDSS直播平台推流成功,不显示直播按钮是什么原因?
  • 经验分享,xps格式转成pdf格式
  • 基于51单片机的音乐彩灯设计
  • API接口设计的艺术:如何提升用户体验和系统性能
  • 韩兴国/姜勇团队在《Trends in Plant Science》发表植物根系氮素再分配的观点文章!
  • 52.Python-web框架-Django - 多语言编译-fuzzy错误
  • Linux自旋锁
  • 服务器----阿里云服务器重启或关机,远程连接进不去,个人博客无法打开
  • go 定时任务
  • Java Character 类
  • MQTT协议应用场景
  • 3.4.马氏链-随机游走的常返性
  • HOT100与剑指Offer
  • 【AI开发】CRAG、Self-RAG、Adaptive-RAG