当前位置: 首页 > news >正文

使用Ollama在本地运行AI大模型gemma

1.下载:

https://github.com/ollama/ollama/releases

2.配置环境变量

我的电脑-右键-属性-系统-高级系统设置-环境变量-【系统环境变量】新建

变量名:OLLAMA_MODELS (固定变量名)
变量值:E:\Ollama\Lib (写自己要存放的路径)

先配置好这个变量,这个是ollama的存储路径。
不配置也可以,不配置的话就会放到默认位置,建议还是修改下存储路径,方便后续使用。
在这里插入图片描述

3.安装

直接install即可。
安装完成后,cmd查询下:ollama --version
如果查询不到,重启下电脑即可。
我这里是因为我直接把ollama给关了,所以出现了警告,不过也同样可以看到ollama客户端的版本。
在这里插入图片描述
ollama的其他命令可以通过ollama help来获取
在这里插入图片描述

4.下载模型

  • 谷歌最新开源gemma:

    • 最低条件:
      2B版本需要2G显存
      7B版本需要4G显存
      7B的其他版本需要更大
  • 打开命令提示符窗口下载运行模型:

    • 访问:https://ollama.com/library选择自己想要的模型,复制下载命令即可.

    • 这里选择拉取gemma7b版本来试试:ollama run gemma:7b

    • 全量版模型拉取运行命令
      ollama run gemma:2b-instruct-fp16
      ollama run gemma:7b-instruct-fp16

  • ollama命令:

    • 查看已有模型:ollama list
  • 下载完成后即在运行
    在这里插入图片描述

  • 接下来可以直接在命令行窗口进行问答
    在这里插入图片描述

  • 拉取的模型可以在存储目录blobs下看到
    在这里插入图片描述

5.整合界面UI

  • Ollama WebUI、open-webui等。
    需要在docker环境中运行,windows本地docker已经被我搞掉了,只有虚拟机里面才有docker环境。
    虚拟机占用内存,破电脑性能一般般,不打算搞了。这个搞起来也还好,就是拉下镜像运行容器就行了。
  • JAN AI:https://jan.ai/ 下载windows版本客户端(开源的)
    1)下载安装后修改下数据存储路径(随便要不要改),修改完重启即可。
    在这里插入图片描述

2)修改ai模型源:
E:\Ollama\JANAI\engines\openai.json
(上一步中的数据存储路径下,找到engines\openai.json进行修改)

{"full_url": "http://localhost:11434/v1/chat/completions"
}

在这里插入图片描述

3)添加模型配置:记得把里面的注释去掉。
E:\Ollama\JANAI\models\底下创建一个文件夹mine-gemma-7b(名字随便,我把models底下其他的文件夹都挪走备份了,方便管理而已)然后在底下创建个model.json文件
在这里插入图片描述

{"sources": [{"filename": "gemma:7b", # 模型名称"url": "https://ollama.com/library/gemma:7b" # 模型url}],"id": "gemma:7b", #模型ID"object": "model","name": "mine-gemma:7b",  #显示在jan中模型名称,随便写不影响"version": "1.0","description": "ollama本地gemma:7b", #随便写不影响"format": "api","settings": {},"parameters": {},"metadata": {"author": "Meta","tags": ["General","Big Context Length"]},"engine": "openai", # 需要配置"state":"ready" # 需要配置
}

在这里插入图片描述
上述配置弄完之后重启下jan,然后再hub中就可以看到自己加的模型了,点击use即可使用
在这里插入图片描述
断网状态下是可以使用的。
在这里插入图片描述

  • chatbox : https://chatboxai.app/zh 下载windows客户端
    直接安装完按照下图选中相应模型就可以使用了。
    都是自动加载的,如果对界面没啥要求的,推荐直接用chatbox就可以了,啥都不用整就可以用了。
    在这里插入图片描述
http://www.lryc.cn/news/335845.html

相关文章:

  • 【IC前端虚拟项目】时序面积优化与综合代码出版本交付
  • windows版本-idea中下载的java版本在哪
  • 设计模式:创建者模式
  • 【linux】基础IO(四)
  • 集合框架(数组,Arrays.sort,list,map,set,stack,queue)蓝桥杯习题
  • 【C++基础】运算符和流程控制语句
  • AOF文件重写
  • 第四次面试总结 — 嘉和智能 - 全栈开发
  • tx-lcn使用
  • oracle恢复异常处理
  • 谈谈什么是 Redis
  • 备战蓝桥杯(java)(日益更新)
  • 06 Php学习:字符串
  • python画图Matplotlib和Seaborn
  • 一体式I/O模块与RS485串口联动,实现工业网络无缝对接
  • 如何在Uniapp真机中使用H.265无插件流媒体播放器EasyPlayer
  • 【MySQL数据库 | 第二十五篇】深入探讨MVCC底层原理
  • 【LAMMPS学习】八、基础知识(1.6) LAMMPS 与其他代码耦合
  • ArrayList中多线程的不安全问题
  • ALTER TABLE 之 定点变更(in-place alter)
  • 【RAG实践】Rerank,让大模型 RAG 更近一步
  • 私有化客服系统:在线客服搭建与部署的创新之路
  • VM-UNet: Vision Mamba UNet for Medical Image Segmentation
  • 面向对象编程:在Python中的面向对象编程奥秘
  • 考研数学|零基础100分保底复习方案+资料分享
  • 【MATLAB源码-第29期】基于matlab的MIMO,MISO,SIMO,SISO瑞利rayleigh信道容量对比。
  • JRT高效率开发
  • Spring Boot 切面的一种的测试方法,java中级开发面试
  • 嵌入式自学路线-高薪路线(持续更新,欢迎关注)
  • SpringMVC的运行流程