当前位置: 首页 > news >正文

评估大语言模型在药物基因组学问答任务中的表现:PGxQA

​这篇文献主要介绍了一个名为PGxQA的资源,用于评估大语言模型(LLM)在药物基因组学问答任务中的表现。

研究背景

药物基因组学(Pharmacogenomics, PGx)是精准医学中最有前景的领域之一,通过基因指导的治疗来提高药物的安全性和疗效。然而,由于缺乏教育和意识,PGx在临床中的应用进展缓慢。大语言模型(LLM)如GPT-4的引入,为开发能够提供及时信息的医疗聊天机器人提供了可能性。

研究目标

研究的主要目标是开发和评估一个名为PGxQA的资源,用于评估LLM在回答PGx相关问题时的表现。该资源旨在帮助临床医生、患者和研究人员更好地理解和利用PGx知识。

方法

自动问题生成:使用Python脚本从CPIC数据库中提取相关信息,并生成问题-答案对。

LLM查询:使用Python脚本将问题发送到本地或远程的LLM服务器,并收集LLM的回答。

手动问题生成:从实际临床和研究环境中收集问题,并手动整理成问题-答案对。

自动评分:开发了一系列自动评分函数来评估LLM的表现,包括数值评分、信息检索评分和文本相似度评分。

人工评审:招募PGx专家对LLM的回答进行人工评审,评估其准确性、完整性和安全性。

结果

自动评分结果:GPT-4在大多数评分指标上表现优异,特别是在数值回答和信息检索任务中表现出色。

人工评审结果:GPT-4的回答在准确性、完整性和安全性方面得分较高,但在某些问题上仍存在错误或危险的回答。

讨论

研究指出,LLM在处理PGx查询时存在一些局限性,如对数值回答的准确性较差、容易生成虚假信息等。为了解决这些问题,提出了几种改进方法,包括提示工程、微调和检索增强生成(RAG)。

结论

PGxQA为评估LLM在PGx任务中的表现提供了一个框架,并展示了GPT-4在这一领域的潜力。未来的研究将继续改进这一框架,以确保LLM在临床环境中的应用更加安全和有效。

欢迎关注“赛文AI药学”!

赛文AI药学,致力于探索人工智能在药学场景中的创新与应用,聚焦药师的AI赋能与专业素养提升。我们提供前沿的AI技术动态、实用的药学场景案例分享以及个性化学习资源,助力药师在智能化时代实现价值跃升。

http://www.lryc.cn/news/508490.html

相关文章:

  • 在本地和远程转储域控制器哈希
  • 基于SSM+Vue的心理咨询问诊系统+LW示例参考
  • 基于TMS320X281X/F28335的DSP入门到精通01_如何开始DSP的学习与开发
  • Java爬虫获取1688 item_search_img接口详细解析
  • Java 连接 FTP 服务器全解析
  • 字节跳动C++面试题及参考答案(下)
  • Rabbit MQ知识总结
  • 未来将要被淘汰的编程语言
  • GO环境安装和配置
  • 面试题整理(四)
  • mathtype中如何在公式和序号之间加点
  • 【电源专题】电源芯片的PG(Power Good)管脚是什么?
  • C/C++圣诞树
  • 牛客--求小球落地5次后所经历的路程和第5次反弹的高度,称砝码
  • cad学习 day6
  • Chrome 浏览器插件获取网页 iframe 中的 window 对象
  • 免费线上签字小程序,开启便捷电子签名
  • IT运维的365天--021 服务器上的dns设置后不起作用
  • 深信服企业级数据备份与恢复系统(整机裸机恢复)
  • Tool之Excalidraw:Excalidraw(开源的虚拟手绘风格白板)的简介、安装和使用方法、艾米莉应用之详细攻略
  • OPPO C++面试题及参考答案
  • Unity中LineRenderer使用MeshCollider方法参考
  • BERT模型入门(1)BERT的基本概念
  • 致命错误: Class ‘ZipArchive‘ not found
  • 二手车交易平台开发:安全与效率的双重挑战
  • vector题目
  • 测试测试测试测试测试测试测试测试测试测试
  • Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
  • 大恒相机开发(3)—大恒相机工业检测的实际案例
  • 【泛微表单】流程相关信息修改