当前位置: 首页 > news >正文

【大模型】RAG

大纲

  1. 用垂域数据,补充LLM的能力
  2. 构建垂域(向量)知识库
  3. 搭建RAG系统需要的模块
  4. 搭建RAG系统的技巧

一、什么是RAG(检索增强的生成模型)

LLM大模型(预训练模型)

目前的局限性:

  1. LLM的知识不是实时的
  2. 不知道私域知识

RAG - retrieval augmented generation

用检索的方法来增强生成模型的能力。

RAG系统的基本搭建流程

    二、向量检索

    2.1 文档的加载和切割

    openai_api_key

    2.2 LLM接口封装

    2.3 prompt模版

    三、向量检索

    向量:从一个点到另一个点到有向线段。

    向量的维度:用一组坐标,表示n维空间中的向量,N是向量的维度。

    文本向量:text embeddings 将文本转成一组N维浮点数。

    语义相似度:向量之间的距离,距离的远近。

    3.1 文本向量是怎么得到的

    3.2 计算向量间的相似度

    numpy 是数据科学中,pyprch的三剑客,

    http://www.lryc.cn/news/624907.html

    相关文章:

  • 基于nvm安装管理多个node.js版本切换使用(附上详细安装使用图文教程+nvm命令大全)
  • ANSI终端色彩控制知识散播(I):语法封装(Python)——《彩色终端》诗评
  • 楼宇自控系统深化设计需关注哪些核心要点?技术与应用解析
  • 第一阶段C#-14:委托,事件
  • ReactNative开发实战——React Native开发环境配置指南
  • 机器翻译论文阅读方法:顶会(ACL、EMNLP)论文解析技巧
  • ADC的实现(单通道,多通道,DMA)
  • 如何编写自己的Spring容器
  • 【EI会议征稿】2025第四届健康大数据与智能医疗国际会议(ICHIH 2025)
  • VS Code Copilot 完整使用教程(含图解)
  • 全局锁应用场景理解
  • 深度学习——R-CNN及其变体
  • 04 类型别名type + 检测数据类型(typeof+instanceof) + 空安全+剩余和展开(运算符 ...)简单类型和复杂类型 + 模块化
  • Spark 运行流程核心组件(三)任务执行
  • 实习两个月总结
  • [系统架构设计师]软件架构的演化与维护(十)
  • SpringBoot--JWT
  • 大数据计算引擎(四)—— Impala
  • React diff——差异协调算法简介
  • 深入解析 Qwen3 GSPO:一种稳定高效的大语言模型强化学习算法
  • 整体设计 之“凝聚式中心点”原型 --整除:智能合约和DBMS的深层融合 之2
  • LLM - MCP传输协议解读:从SSE的单向奔赴到Streamable HTTP的双向融合
  • 【软考架构】第4章 信息安全的抗攻击技术
  • 群晖nas中 打开PHP连接MariaDB 功能扩展
  • CMakeLists.txt 学习笔记
  • SQL详细语法教程(六)存储+索引
  • Vue3+Vite MPA多页面应用开发完整指南 – 从零搭建到部署优化
  • 博客项目 Spring + Redis + Mysql
  • Linx--MySQL--安装笔记详细步骤!
  • B4265 [朝阳区小学组 2019] rectangle