当前位置: 首页 > news >正文

在MacOS上打造本地部署的大模型知识库(一)

一、在MacOS上安装Ollama

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

最后停掉Docker的ollama,就能在webui中加载llama模型

二、在MacOS上安装Docker

科学上网

# 进入 open-webui 目录 cd /volume1/docker/open-webui # 将 docker-compose.yml 放入当前目录 # 一键启动 docker-compose up -d

三、在MacOS上安装Open-webui

安装CPU模式的open-webui

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在浏览器地址上输入http://0.0.0.0:3000,会打开如下界面

本人是MacOS系统,晚上自动转成了黑色风格,可忽略;如果是第一次运行,需要注册一个管理者账号,然后登录。你也可以再创建普通用户,这样可以进行分级登录管理。将Open WebUI的管理者和普通用户做好区分,以便企业知识库做权限分离管理。每个部门可以搭建单独且互不影响的知识库。并且可以针对不同部门,使用不同的大模型以适应业务需要。

四、在Open WebUI上导入知识库

我之前在向量模型这里遇到了困难。尝试加载了很多向量模型,结果进行文档内容查询生成的时候出现了幻觉(没有生成高质量需要的内容)。后来反复尝试发现只有默认的向量模型引擎设置,选择向量模型"sentence-transformers/all-MiniLM-L6-v2"后,才能真正实现知识库文档的内部查询输出效果。选择其他向量模型的时候,遇到过如下问题:

1、维度不一致报错;这是因为每次切换向量模型的时候,由于已经上传的文档是按照之前向量模型的结构做了向量化处理。在新的向量模型设置成功后,不能自动切换新的设置。需要将老文档删除,并删除chromadb的文件。在Docker中重启open webui的镜像后,重新上传知识文档。

2、选择其他Ollama支持的向量模型后,发现生成内容并没有在已上传的知识文档中查询生成。这个问题留待后续继续跟踪分析。

http://www.lryc.cn/news/543794.html

相关文章:

  • (21)从strerror到strtok:解码C语言字符函数的“生存指南2”
  • DeepSeek推出DeepEP:首个开源EP通信库,让MoE模型训练与推理起飞!
  • 1.2 Kaggle大白话:Eedi竞赛Transformer框架解决方案02-GPT_4o生成训练集缺失数据
  • 数据结构-顺序表专题
  • docker和containerd从TLS harbor拉取镜像
  • kafka-关于ISR-概述
  • el-input实现金额输入
  • C++11智能指针
  • 安装Git(小白也会装)
  • 驭势科技9周年:怀揣理想,踏浪前行
  • 一款在手机上制作电子表格
  • Python解决“比赛配对”问题
  • 【AI论文】RAD: 通过大规模基于3D图形仿真器的强化学习训练端到端驾驶策略
  • Web开发:ORM框架之使用Freesql的导航属性
  • 【docker】namespace底层机制
  • 【每天认识一个漏洞】url重定向
  • 端口映射/内网穿透方式及问题解决:warning: remote port forwarding failed for listen port
  • Polardb开发者大会
  • 从二维随机变量到多维随机变量
  • Vulnhub靶场 Kioptrix: Level 1.3 (#4) 练习
  • 权重生成图像
  • 实时时钟(RTC)/日历芯片PCF8563的I2C读写驱动(2):功能介绍
  • 猿大师播放器:HTML内嵌VLC播放RTSP视频流,无需转码,300ms级延迟,碾压服务器转码方案
  • 牛客刷题自留-深度学习
  • AI 时代下,操作系统如何进化与重构?
  • Hadoop最新版本hadoop-3.4.1搭建伪分布式集群以及相关报错解决
  • Android SDK与NDK的区别
  • 【保姆级视频教程(二)】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测!
  • smolagents学习笔记系列(八)Examples - Master you knowledge base with agentic RAG
  • 满血版DeepSeek R1使用体验