当前位置: 首页 > news >正文

【大模型】大模型项目选择 RAGvs微调?

RAG

输入问题,在知识库匹配知识,构建提示词:基于{知识}回答{问题}

微调

用知识问答对重新训练大模型权重,输入问题到调整后的大模型

如何选择

如果业务要求较高,RAG和微调可以一起使用

1-动态数据

选择RAG
原因:RAG将数据存放到数据库即可,微调需要重新训练模型,微调成本大

2-模型能力定制

选择微调
原因:用户想要回答有特殊口吻/专业内容等,如猫娘大模型/阅读研报/文本抽取内容,微调可以定制回答

3-幻觉

选择RAG
原因:带有上下文知识的输入会减少模型幻觉的产生

4-可解释性

选择RAG
原因:RAG可以给用户输出知识库数据供参考,提高回答可信度

5-成本

选择RAG
原因:RAG只需要构建出知识图谱/知识数据库即可,而微调需要考虑数据集质量以及不断训练模型,微调成本高

6-依赖大模型通用能力

选择RAG
原因:微调会改变大模型的权重,提高模型专业能力,但会降低模型通用能力(模型遗忘)

7-延迟

选择微调
原因:RAG会有如知识库检索、排序、匹配等操作,会耗时

8-智能设备

选择微调
原因:移动端小模型,业务场景需要突出专业能力
http://www.lryc.cn/news/506312.html

相关文章:

  • 2024年12月CCF-GESP编程能力等级认证Python编程一级真题解析
  • 【机器学习】元学习(Meta-learning)
  • 详解Redis的String类型及相关命令
  • android RadioButton + ViewPager+fragment
  • 给机器装上“脑子”—— 一文带你玩转机器学习
  • 论文笔记:是什么让多模态学习变得困难?
  • ChatGPT Search开放:实时多模态搜索新体验
  • Centos7.9 离线安装docker
  • C语言函数在调用过程中具体是怎么和栈互动的?
  • 【Java中常见的异常及其处理方式】
  • 如何更新项目中的 npm 或 Yarn 依赖包至最新版本
  • SpringBoot3整合FastJSON2如何配置configureMessageConverters
  • 《Vue3实战教程》2:Vue3快速上手
  • ubuntu 24.04.1安装FTP流程
  • 多功能护照阅读器港澳通行证阅读机RS232串口主动输出协议,支持和单片机/Linux对接使用
  • 5个用于构建Web应用程序的Go Web框架
  • Qt中的异步相关类
  • 浅谈仓颉语言的优劣
  • Linux 显示系统活动进程状态命令 ps 详细介绍
  • scala中正则表达式的使用
  • 数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
  • cocos creator制作2dTop-down游戏(虚拟摇杆、地图加载)
  • SQL Server 批量插入数据的方式汇总及优缺点分析
  • linux上抓包RoCEv2
  • 【机器学习与数据挖掘实战】案例04:基于K-Means算法的信用卡高风险客户识别
  • UDP网络编程套接
  • 期权VIX指数构建与择时应用
  • QT笔记- QClipboard剪切板对QByteArray数据的复制与粘贴
  • Python使用PyMySQL操作MySQL完整指南
  • IAR中如何而将定义的数组放在指定的位置