当前位置: 首页 > news >正文

使用ollama本地部署Deepseek r1

1、下载ollama

在浏览器地址输入:https://ollama.com/
在这里插入图片描述

选择windows版本的下载
在这里插入图片描述

2、安装ollama

在这里插入图片描述

3、运行ollama

安装完成后,打开命令行工具win +r
在命令行输入:ollama
在这里插入图片描述

4、使用ollama下载并部署Deepseed r1

在ollama网站,下载DeepSeek-R1模型
在这里插入图片描述
根据本地机器大小选择合适的版本,点击复制按钮
在这里插入图片描述
打开命令行工具win +r,输入ollama run deepseek-r1:7b
在这里插入图片描述
等待下载完成安装完成后。
在这里插入图片描述
输入问题,回车
在这里插入图片描述
表明安装成功。

ollama常用参数

Ollama安装完成之后,有几个常用的系统环境变量参数建议进行设置:

OLLAMA_MODELS:模型文件存放目录,默认目录为当前用户目录(Windows 目录:C:\Users%username%.ollama\models,MacOS 目录:~/.ollama/models,Linux 目录:/usr/share/ollama/.ollama/models),如果是 Windows 系统建议修改(如:D:\OllamaModels),避免 C 盘空间吃紧
OLLAMA_HOST:Ollama 服务监听的网络地址,默认为127.0.0.1,如果允许其他电脑访问 Ollama(如:局域网中的其他电脑),建议设置成0.0.0.0,从而允许其他网络访问
OLLAMA_PORT:Ollama 服务监听的默认端口,默认为11434,如果端口有冲突,可以修改设置成其他端口(如:8080等)
OLLAMA_ORIGINS:HTTP 客户端请求来源,半角逗号分隔列表,若本地使用无严格要求,可以设置成星号,代表不受限制
OLLAMA_KEEP_ALIVE:大模型加载到内存中后的存活时间,默认为5m即 5 分钟(如:纯数字如 300 代表 300 秒,0 代表处理请求响应后立即卸载模型,任何负数则表示一直存活);我们可设置成24h,即模型在内存中保持 24 小时,提高访问速度
OLLAMA_NUM_PARALLEL:请求处理并发数量,默认为1,即单并发串行处理请求,可根据实际情况进行调整
OLLAMA_MAX_QUEUE:请求队列长度,默认值为512,可以根据情况设置,超过队列长度请求被抛弃
OLLAMA_DEBUG:输出 Debug 日志标识,应用研发阶段可以设置成1,即输出详细日志信息,便于排查问题
OLLAMA_MAX_LOADED_MODELS:最多同时加载到内存中模型的数量,默认为1,即只能有 1 个模型在内存中

http://www.lryc.cn/news/531539.html

相关文章:

  • Unity飞行代码 超仿真 保姆级教程
  • DeepSeek蒸馏模型:轻量化AI的演进与突破
  • 使用 sunshine+moonlight 配置串流服务无法使用特殊键
  • 5.角色基础移动
  • 单细胞-第四节 多样本数据分析,下游画图
  • Linux的循环,bash的循环
  • 【DeepSeek开发】Python实现股票数据可视化
  • 华为小米vivo向上,苹果荣耀OPPO向下
  • 毕业设计:基于深度学习的高压线周边障碍物自动识别与监测系统
  • el-table表格点击单元格实现编辑
  • 数据结构:时间复杂度
  • SPI(Serial Peripheral Interface)串行外围设备接口
  • Java 8 Stream API
  • 亚博microros小车-原生ubuntu支持系列:21 颜色追踪
  • GESP6级语法知识(六):(动态规划算法(六)多重背包)
  • MySQL 事务实现原理( 详解 )
  • AI协助探索AI新构型自动化创新的技术实现
  • 九. Redis 持久化-RDB(详细讲解说明,一个配置一个说明分析,步步讲解到位)
  • mac连接linux服务器
  • oracle: 表分区>>范围分区,列表分区,散列分区/哈希分区,间隔分区,参考分区,组合分区,子分区/复合分区/组合分区
  • 使用Pygame制作“走迷宫”游戏
  • AJAX案例——图片上传个人信息操作
  • Day35-【13003】短文,什么是双端队列?栈和队列的互相模拟,以及解决队列模拟栈时出栈时间开销大的方法
  • 力扣 55. 跳跃游戏
  • 深入剖析 HTML5 新特性:语义化标签和表单控件完全指南
  • 本地快速部署DeepSeek-R1模型——2025新年贺岁
  • MVC 文件夹:架构之美与实际应用
  • Redis --- 秒杀优化方案(阻塞队列+基于Stream流的消息队列)
  • 如何确认设备文件 /dev/fb0 对应的帧缓冲设备是开发板上的LCD屏?如何查看LCD屏的属性信息?
  • C++多线程编程——基于策略模式、单例模式和简单工厂模式的可扩展智能析构线程