当前位置: 首页 > news >正文

NLP与LLM的工程化实践与学习思考 - 写在开头

NLP与LLM的工程化实践与学习思考[24年半年工作总结] - 写在开头

  • 0 开头的开头

0 开头的开头

24年因为一些工作原因,短暂在NLP领域遨游了半年。这半年对我的影响蛮大,一来是因为此前从没接触过这个方向学到新东西挺开心的,二来是在工程化实践有了一些新的思考,包括项目架构设和如何从零学习一个新的体系。(这个专栏主要想写这段时间学到的东西和一些思考,至于学习体系可能后面有空开个贴写,关于架构这一块儿仍然一知半解,后面系统学习整理一下)(希望不会烂尾,争取慢慢写完)

  • 关于我这半年搞了什么🧐🧐

总结一下就是,基于 知识图谱+专家系统+LLM的医疗精准问答及辅助诊断系统

  • 用到了哪些技术?

知识图谱搭建 、关系抽取、情感分析、实体抽取、同义词匹配、向量数据库、LLM等

  • 为什么在当前大模型井喷的时候仍然选择分解为知识图谱+专家系统的核心模块?

这个问题后面会仔细从工程、开发及市场(?)的角度解释,这里先简要概括一下原因。第一是因为应用领域特殊,医疗和其它垂直领域最大的区别或者说应用分歧在于,它是直接作于人的,从技术开发的角度来说,直接使用一个大模型力大砖飞可以做出一个看起来既吸睛,又高端的医疗大模型,看上去能解决一切问题。但是从患者角度来看呢,你是否信任一个黑箱告诉你的诊断和决策。这涉及一个很重要的点 - 可解释性
我们作为开发者,必须为直接或间接使用这套系统的用户(患者、医生、亲属)负责。而任何一个从事本领域开发的技术人员都知道大模型有一个不容忽视的问题 - 幻觉 。这也是我们选择弱化大模型在整体系统中的核心地位的主要原因。我们不希望因为这套系统在出于技术促进医疗的目的下,直接或间接造成本不该出现的医疗事故。

  • 为什么选择知识图谱?

讲道理,知识图谱是大模型风靡之前,NLP领域占有极大重量的一个分支,单论知识图谱搭建及生成技术早就不新奇,甚至不夸张的说现在任何一个成熟领域几乎都有其专有公开图谱。但是似乎大家对图谱的开发也就到此为止,一个好看的界面、一个开放图谱。那么我们如何把这项老掉牙(?)的技术玩出花来,嗯,是一个值得深思的问题。

  • 截止离职,已经做到了什么?

我们可以根据医患历史对话及患者病史,通过结合图谱分析当前症状、地域、历史病症、用药情况等,作出潜在疾病风险预警、潜在症状问诊提示、在库用药推荐等。成功打通前后端、算法全流程部署。


这套系统是我工作以来第一次完整的搭建和设计的系统,里面一定会有稚嫩和缺失的内容,但是自觉已经做到了能力范围内的尊重伦理道德的技术实践。这套系统也是全然不同于公开方案的新的pipeline设计,尽管截止离职,这套系统刚实现到我整体技术规划的30%,大概属于刚打好地基的程度。后面的技术规划也属于是业内独有功能设计,最最最重要的一点是,它是可解释的。

出于职业道德,后续文章不会讲解具体的系统技术细节,我会尽可能的拆分成独立知识点,用以记录这半年短暂的知识遨游😁👌。

另外,离职后,老大后面很开心的告诉我在此基础上做了后续的工作,它已经越来越像一个人啦O(∩_∩)O

done

http://www.lryc.cn/news/500300.html

相关文章:

  • LeetCode322. 零钱兑换(2024冬季每日一题 28)
  • Unix、GNU、BSD 风格中 ps 参数的区别
  • 单片机读写内部flash实现断电数据存储
  • 注意力机制介绍
  • 爬虫运行后数据如何存储?
  • C# 自动自定义截图的内容
  • Java的Stream流:文件处理、排序与串并行流的全面指南
  • [Maven]下载安装、使用与简介
  • 056 WXML+ WXSS+PHP+LW+校园配送商城微信小程序开发与设计 源码 文档 全套资料
  • Python 在同一/或不同PPT文档之间复制幻灯片
  • C#生成CSR(CertificateSigningRequest)和密钥
  • Docker 安装 Oracle创建表空间并导入数据库
  • elementui table子级tree懒加载bug
  • AI与低代码技术融合:如何加速企业智能化应用开发?
  • 【C#】新建窗体文件,Form、UserControl
  • ansible学习笔记之02command模块与shell模块
  • 在Docker中部署禅道,亲测可用
  • C++(十二)
  • 【数学建模】线性规划问题及Matlab求解
  • 【JavaWeb后端学习笔记】Spring全局异常处理器
  • PT8M2102 触控型 8Bit MCU
  • 4. React 性能优化技巧:如何让你的应用更快
  • pytest中使用conftest做测试前置和参数化
  • Spring Boot 中使用 @Transactional 注解配置事务管理
  • MATLAB 建筑顶面面积计算(95)
  • Linux网络编程之---组播和广播
  • Apache Dolphinscheduler可视化 DAG 工作流任务调度系统
  • docker 部署共享文档ZFile
  • 面试题之JVM
  • 二叉树的深搜(不定期更新。。。。。)