当前位置: 首页 > news >正文

书生·浦语大模型实战营 | 第3次学习笔记

前言

书生·浦语大模型应用实战营 第二期正在开营,欢迎大家来学习。(参与链接:https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg

第三堂课的视频链接:https://www.bilibili.com/video/BV1QA4m1F7t4/

本次笔记是学习完第三堂课,结合自己关心内容而创作,更偏向个人。尽管有很多细节丢失,但组织出来的内容仍反映本节课的关键知识、也是我的收获,与大家分享。

论述

引出RAG

RAG中文名叫检索生成技术,它是怎样一个技术呢?
市面上有很多通用大模型
这是书生浦语自主研发的模型评测平台

它们神通广大、无所不知,有着惊人的能力。但是事情总有我们不如意的时候,这些通用大模型可能会在某些垂直领域回答还是不尽人意,无法满足我们的业务需求。怎么办?

我们可以微调大模型,去更新它的网络参数。但面对闭源模型,你没办法了。还能怎么办?RAG技术就可以解决这样的困境,在不改变大模型本身能力的同时,能提升它回答的表现!这是一种神奇的方法,一种外挂知识库的方法。

RAG到底是怎么做到的?简单点说就是从直接prompt到给大模型做阅读理解将用户的提问去知识库里匹配相关的信息,然后组合在一起再prompt给大模型。实践验证这种方法很好,大大提升了相关领域的回答表现。

我们来看RAG技术加持下,大模型问答的运行机制是怎样的

RAG技术加持的大模型的运行机制

请添加图片描述

以上就是大模型问答实质的运行机制。接下来,我以开发者的视角来讲解这张图

前面我们已经知道RAG实际是怎么提升回答表现的。作为开发者呢,我们首先得去搭建知识库,整个开发的过程我们都是再Langchain框架下的,在该框架下让我们的开发更容易。

我们收集了大量的文件材料,它们有word、有excel、pdf、markdown等等等等。我们首先做的就是对这些文件材料去除格式,这里我们就要用到去除文本结构器,就是个工具,不必焦虑在哪里找它们,Langchain为你们提供了。去除了文件的格式我们得到了纯字符串的文本信息。

这一个字符串可能10万个字符,我们要对它切割,用Langchain提供的文本分割器来实现。

我们得到了文本片段集合,然后对这一个个片段进行编码成一个个向量,这种形式的信息方便进行相关度比较。于是我们构建起了向量数据库,也可以叫做知识库,里面都是知识嘛。

这都是开发阶段做的工作。在实际用户提出一个提问/prompt后是怎样个运行机制呢?

首先用户的提问也要进行编码成向量,为了可以与向量数据库的信息检索匹配嘛。

然后从向量数据库里检索出了相关的向量信息。直接将向量输入到大模型?我们做不了。那是要解码吗?也不是,实际上无论是prompt向量还是知识库里的向量,在编码的时候都是建立了与自然语言文本一一对应的关系的。我们直接凭借着这个对应关系,找到对应的自然语言文本拼接在一起就行了。

然后就是喂给大模型,图中展示的是Internlm大模型。最后我们就得到了回答了。以上就是理论上RAG下的大模型问答的运行机制。




————————
以上就是我本篇想讲的所有内容了,如果这篇文章对你有价值的话,还请点个赞,你的支持对我非常重要!

我是阿航,一位胆大包天、梦想成为大牛的学生~

我们下篇文章接着聊

http://www.lryc.cn/news/339356.html

相关文章:

  • easyExcel - 按模板导出
  • 使用 Tranformer 进行概率时间序列预测实战
  • LLM大语言模型助力DataEase小助手,新增气泡地图,DataEase开源数据可视化分析平台v2.5.0发布
  • 维修伊顿触摸屏不显示工业电脑人机界面EATON XVS-430-10MPI-1-10 深圳捷达工控维修
  • 趣话最大割问题:花果山之群猴博弈
  • 上周面试了一个大模型算法岗的女生,有点崩溃。。。
  • AI系列:大语言模型的function calling
  • conda 创建、激活、退出、删除虚拟环境
  • 【Entity Framework】聊一聊EF中继承关系
  • curaengine编译源码之libarcus编译记录
  • 运用OSI模型提升排错能力
  • 【Node.js】Express学习笔记(黑马)
  • Linux系统部署Tale个人博客并发布到公网访问
  • CentOS7里ifcfg-eth0文件不存在解决方案/Centos7修改网络IP解决方案
  • go第三方库go.uber.org介绍
  • Oracle 正则表达式
  • MongoDB聚合运算符:$rand
  • 如何在Linux通过docker搭建Plik文件系统并实现无公网IP管理内网文件
  • k8s部署efk
  • AI模型大PK
  • Matlab|基于广义Benders分解法的综合能源系统优化规划
  • vscode 打代码光标特效
  • 【代码随想录算法训练营第四十八天 | LeetCode198.打家劫舍、213.打家劫舍II、337.打家劫舍III】
  • 蓝桥杯 — —灵能传输
  • 智慧安防系统EasyCVR视频汇聚平台接入大华设备无法语音对讲的原因排查与解决
  • 基于Pytorch框架的CNN-LSTM模型在CWRU轴承故障诊断的应用
  • QQ 邮箱使用 SMTP 发送邮件报错:550 The From header is missing or invalid
  • mysql中的视图
  • 树莓派点亮双色LED
  • DAY27| 39. 组合总和 ,40.组合总和II ,131.分割回文串