当前位置: 首页 > news >正文

Ollama+Deepseek+Docker+RAGFlow打造自己的私人AI知识库

打造自己的AI知识库

架构

Ollama+Deepseek+Docker+RAGFlow


部署大模型

下载并安装Ollama

官网地址:Download Ollama on Windows

选择合适版本进行下载安装(注意修改模型下载位置)

在这里插入图片描述

Ollama环境变量配置

增加两个环境变量(rag访问ollama需要)

OLLAMA_HOST:0.0.0.0:11434
OLLAMA_MODELS:E:\AIData\OllamaModels

在这里插入图片描述

部署大模型DeepSeek-R1-Distill-Qwen-14B-GGUF:Q6_K

基于自己硬件配置选择合适的大模型,此大模型适合12g显存,个人可选择量化模型,精度损失不高,速度更快,显存要求大幅下降

ollama run hf.co/bartowski/DeepSeek-R1-Distill-Qwen-14B-GGUF:Q6_K

在这里插入图片描述

部署RAG

RAG下载

克隆仓库:ragflow/README_zh.md at main · infiniflow/ragflow

$ git clone https://github.com/infiniflow/ragflow.git

在这里插入图片描述

找到安装文件,由于默认轻量版无embedding模型,要改写配置

在这里插入图片描述

下载并安装Docker

Windows | Docker Docs

在这里插入图片描述

配置镜像加速器(不配的话,会经常超时失败)
在这里插入图片描述

{"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},"experimental": false,"features": {"buildkit": true},"insecure-registries": [],"registry-mirrors": ["https://docker.1ms.run"]
}
拉取RAG镜像

执行命令:

$ cd ragflow/docker
# Use CPU for embedding and DeepDoc tasks:
$ docker compose -f docker-compose.yml up -d# To use GPU to accelerate embedding and DeepDoc tasks:
# docker compose -f docker-compose-gpu.yml up -d

在这里插入图片描述
到这里就已经完全部署好了,剩下的就在页面配置了

最终页面配置

页面访问地址:http://127.0.0.1/user-setting/model

大模型配置

设置默认模型
在这里插入图片描述

创建知识库

在这里插入图片描述
上传文档,注意上传后一定要点解析
在这里插入图片描述

新建助理

选择知识库
在这里插入图片描述

按需调整参数

在这里插入图片描述

创建聊天

在这里插入图片描述

http://www.lryc.cn/news/616166.html

相关文章:

  • C语言深度剖析
  • Docker 详细介绍及使用方法
  • 【东枫科技】 FR2 Massive MIMO 原型验证与开发平台,8*8通道
  • DBSACN算法的一些应用
  • 力扣-20.有效的括号
  • Design Compiler:布图规划探索(ICC II)
  • 【FPGA】初识FPGA
  • Jotai:React轻量级状态管理新选择
  • 密码学的数学基础2-Paillier为什么产生密钥对比RSA慢
  • 重学React(四):状态管理二
  • 机器学习第八课之K-means聚类算法
  • 编程基础之多维数组——计算鞍点
  • 【Docker实战】将Django应用容器化的完整指南
  • 【代码随想录day 15】 力扣 257. 二叉树的所有路径
  • [FOC电机控制] 电压频谱图
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘ray’问题
  • Redis一站式指南一:从MySQL事务到Redis持久化及事务实现
  • 【每天一个知识点】深度领域对抗神经网络
  • MACBOOK M1安装达梦8数据库
  • nginx-主配置文件
  • 异步问题的概念和消除问题技巧
  • 【Tomcat】企业级web应用服务器
  • ATF(TF-A)安全通告 TFV-12(CVE-2024-5660)
  • nestjs官网推荐typeorm而不是prisma的原因
  • 实现MATLAB2024b和M文件关联(防止运行多个MATLAB)
  • 【0基础3ds Max】主工具栏介绍(下)
  • 金融机构在元宇宙中的业务开展与创新路径
  • ATF(TF-A)安全通告 TFV-13(CVE-2024-7881)
  • vue3项目中在一个组件中点击了该组件中的一个按钮,那么如何去触发另一个组件中的事件?
  • RAG (Retrieval-Augmented Generation) 原理详解与实例