当前位置: 首页 > news >正文

RAG与Langchain简介

RAG与Langchain简介

  • 什么是RAG
  • RAG解决的问题
  • RAG工作流程
  • RAG调优策略
  • LangChain简介

什么是RAG

检索增强生成(Retrieval-Augmented Generation),主要是通过从外部给大模型补充一些知识,相当于给模型外挂了一个知识库,让模型减少幻觉,生成更加精确的答案

RAG解决的问题

1.每次有新的知识加入,都需要进行微调,成本大
2.训练模型的成本是很高的

RAG工作流程

在这里插入图片描述

检索(Retrieve):把用户的问题送到知识库中进行检索相关内容,返回相似的前n个内容
增强(Augment):用户的问题和检索的内容放在一起,构成一个prompt
生成(Generate):将prompt送入LLM中

RAG调优策略

在这里插入图片描述

LangChain简介

LangChain 是一个用于开发由语言模型驱动的应用程序的框架。他主要拥有 2 个能力:
1.可以将 LLM 模型与外部数据源进行连接
2.允许与 LLM 模型进行交互

基本概念:
loader加载器:从哪里加载数据
document文档:将数据转换为Document对象
文本分割:受限于大模型token数量,将长文本分割
向量数据库:将数据向量化存入库中,便于搜索匹配
chainl链:一个chain就是一个任务,一个一个的执行多个任务
Agent代理:
在这里插入图片描述

http://www.lryc.cn/news/374848.html

相关文章:

  • 绕过网页的阻止复制
  • Jackson指定json的key
  • 谷歌发布Infini-Transformer模型—无限注意力机制长度,超越极限
  • 激光点云配准算法——Cofinet / GeoTransforme / MAC
  • socket--cs--nc简单实现反弹shell
  • CSS入门基础2
  • Mac vscode could not import github.com/gin-gonic/gin
  • MySQL修改用户权限(宝塔)
  • 论文阅读(一种新的稀疏PCA求解方式)Sparse PCA: A Geometric Approach
  • Chrome/Edge浏览器视频画中画可拉动进度条插件
  • pg修炼之道学习笔记
  • 使用宝塔面板部署Django应用(不成功Kill Me!)
  • c++深拷贝、浅拷贝
  • k8s核心组件
  • 反编译腾讯vmp
  • Ollama:本地部署大模型 + LobeChat:聊天界面 = 自己的ChatGPT
  • JS中splice怎么使用
  • Flutter项目,Xcode15, 编译正常,但archive报错
  • 云动态摘要 2024-06-17
  • 【JavaScript脚本宇宙】图像处理新纪元:探索六大JavaScript图像处理库
  • 使用python调ffmpeg命令将wav文件转为320kbps的mp3
  • 程序启动 报错 no main manifest attribute
  • java-内部类 2
  • 【小技巧】pycharm中自动换行的实现
  • 如何修改倍福CX7000PLC IP地址
  • python安装flask,flask框架,使用静态文件、模板、get和post请求
  • Docker:Harbor
  • 2024 6.10~6.16 周报
  • clickhouse学习笔记(四)库、表、分区相关DDL操作
  • 聚焦现代商贸物流愿景 构筑供应链金融服务体系|第二届京津冀现代商贸物流金融创新发展百人大会成功举办