当前位置: 首页 > news >正文

【RAG】内部外挂知识库搭建-本地GPT

大半年的项目告一段落了,现在自己找找感兴趣的东西学习下,看看可不可以搞出个效果不错的local GPT,自研下大模型吧

RAG是什么?
检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。
https://github.com/chatchat-space/Langchain-Chatchat

搭建local GPT:https://github.com/PromtEngineer/localGPT
==》本地版的 GPT,可以下載 source code

学习视频:https://www.youtube.com/watch?v=MlyoObdIHyo

  • 1、Clone code
git clone https://github.com/PromtEngineer/localGPT.git
  • 2、安装 conda:https://www.anaconda.com/download-success
  • 3、安装pip依赖:pip install -r requirements.txt
  • 4、安装 LLAMA-CPP :
    LocalGPT 使用 LlamaCpp-Python 进行 GGML(需要 llama-cpp-python <=0.1.76)和 GGUF(llama-cpp-python >=0.1.83)模型。

苹果芯片用:

# Example: METAL
CMAKE_ARGS="-DLLAMA_METAL=on"  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

NVIDIA芯片用:

# Example: cuBLAS
CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

docker官方文档:https://www.dockerdocs.cn/engine/index.html

基本概念
https://ithelp.ithome.com.tw/users/20120030/ironman/5515

效果
https://docs.google.com/presentation/d/1dkfd9cAwsHfM2jdKtn6RHixecoD6X1lF2Mby60YxmT4/edit#slide=id.g201e72434cd_0_245

参考学习:https://blog.csdn.net/u013010473/category_11657660.html?spm=1001.2014.3001.5482


将文件放入 SOURCE_DOCUMENTS 文件夹中。在 SOURCE_DOCUMENTS 文件夹中放置多个文件夹,代码将递归读取文件。

LocalGPT 目前支持以下文件格式。 LocalGPT 使用 LangChain 来加载这些文件格式。 Constants.py 中的代码使用 DOCUMENT_MAP 字典将文件格式映射到相应的加载器。为了添加对其他文件格式的支持,只需添加该字典以及该文件格式和来自 LangChain 的相应加载器即可。

DOCUMENT_MAP = {".txt": TextLoader,".md": TextLoader,".py": TextLoader,".pdf": PDFMinerLoader,".csv": CSVLoader,".xls": UnstructuredExcelLoader,".xlsx": UnstructuredExcelLoader,".docx": Docx2txtLoader,".doc": Docx2txtLoader,
}
http://www.lryc.cn/news/331097.html

相关文章:

  • MySQL——锁
  • C++(12): std::mutex及其高级变种的使用
  • 基于ROS软路由的百元硬件升级方案实现突破千兆宽带
  • OpenHarmony实战开发-分布式关系型数据库
  • 图片标注编辑平台搭建系列教程(6)——fabric渲染原理
  • Qt中QIcon图标设置(标题、菜单栏、工具栏、状态栏图标)
  • C语言程序10题
  • 定时器-间歇函数
  • Ajax-XMLHttpRequest基本使用
  • 门控循环单元(GRU)
  • 789. 数的范围 (二分学习)左端大右,右端小左
  • docker logs 查找日志常用命令
  • 百卓Smart管理平台 importexport.php SQL注入漏洞复现(CVE-2024-27718)
  • PHP教程_PHP5函数str_replace替换字符串中的字符
  • Word的”交叉引用“和”插入题注“快捷键设置
  • 小白从0学习ctf(web安全)
  • 【嵌入式开发 Linux 常用命令系列 7.4 -- awk 处理文件名,去除后缀只保留文件名】
  • Linux重点思考(中)--端口/静态内存/负载/日志
  • 【Go】五、流程控制
  • 数据开发-面试真题。
  • 如何使用免费的ChatGpt3.5
  • Kafka硬核干货
  • 分享几个可以免费使用的GPT网站吧
  • MySQL进阶-----前缀索引、单例与联合索引
  • HTTP——Cookie
  • Scala大数据开发
  • windows无法使用hadoop报错:系统找不到路径
  • 从0配置React
  • File和IO流
  • 2024系统架构师---解释器架构风格的概念与应用