当前位置: 首页 > news >正文

Text2sql的一些技巧

最近看到了一篇关于text2sql的文章,以及一些论文。对使用模型做text2sql给了一些不错的建议。

参考文章:24年大模型潜力方向:大浪淘沙后的Text-to-SQL和Agent - 知乎

论文:https://arxiv.org/pdf/2403.09732.pdf

关于模型的建议

模型的温度为0,减少text2sql的幻觉问题。

多个模型一起使用,使用交叉一致性,不要过于依赖一个模型。

构建prompt的建议

表中字段取值问题,例如性别这个字段,有的表可能存“男”和“女”,有的表可能存 “M”和“F”,甚至有的表会存“0”和“1”。所以对于有枚举值的字段来说,最好能够列出来示例字段。数据表和样例数据(随机取三行数据)

text2sql中,few-shot非常有用。应该生成一些常见的sql示例。这些案例在prompt中应该是动态选择的(针对不同的表)。关于生成常见的sql,可以考虑使用模型,来生成一些sql示例。

few-shot 示例

告诉模型,我们的表字段,并给出了一些示例数据以及表的外键

给模型的few-shot 对生成正确的sql的影响非常大。论文中提到的是动态的选择样例,

根据问题相似相匹配,用问题,召回几个相似的文本(这里需要提前根据表生成一些案例)。

 


 

 

http://www.lryc.cn/news/341064.html

相关文章:

  • aws云靶场和一些杂记
  • 《AI编程类工具之四——GitHub copiot》
  • Unity类银河恶魔城学习记录13-1 p142 Save system源代码
  • 【C++杂货铺】继承
  • 快速上手Linux核心命令
  • 背 单 词 (考研词汇闪过)
  • 数据库工具解析之 OceanBase 数据库导出工具
  • [Algorithm][滑动窗口][长度最小的子数组] + 滑动窗口原理
  • .NET 发布,部署和运行应用程序
  • B树(B-tree)
  • EelasticSearch是什么?及EelasticSearch的安装
  • Python机器学习项目开发实战:如何进行语音识别
  • 2024年五一杯数学建模C题思路分析
  • 【代码】Python3|Requests 库怎么继承 Selenium 的 Headers (2024,Chrome)
  • JAVA程序设计-对象设计
  • 蓝桥杯2024年第十五届省赛真题-R 格式
  • Linux服务器硬件及RAID配置
  • 前端 vue单页面中请求数量过多问题 控制单页面请求并发数
  • HarmonyOS开发实例:【分布式手写板】
  • Unity TMP Inputfield 输入框 框选 富文本 获取真实定位
  • 如何在原生项目中集成flutter
  • 【设计模式】策略模式
  • Java面试八股之Iterator和ListIterator的区别是什么
  • 服务器中毒怎么办?企业数据安全需重视
  • k8s使用harbor私有仓库镜像 —— 筑梦之路
  • tcp bbr pacing 的对与错
  • MySQL学习-非事务相关的六大日志、InnoDB的三大特性以及主从复制架构
  • 【软件测试】MIL/HIL/PIL/SIL测试
  • WebKit结构深度解析:打造高效与安全的浏览器引擎
  • SQLSERVER对等发布问题处理