当前位置：首页 > news >正文

【LLM】一、利用ollama本地部署大模型

news 2025/8/16 10:42:41

前言

一、Ollama 简介

1、什么是Ollama

2、特点：

二、Windows部署

1.下载

2.安装

3.测试安装

4.模型部署：

5.注意

三、 Docker部署

1.docker安装

2.ollama镜像拉取

3.ollama运行容器

4.模型部署：

5.注意：

总结

前言

最近，自己在学习一些大模型的相关知识，所以近期会不定时更新大模型的实操指南，这里为LLM系列第一篇文章，主要内容是在本地搭建自己的LLM服务。

随着AI的发展，越来越多的开软软件供我们选择，如：Hugging Face 、Transformers、LangChain、Ollama、vllm等，本篇以O llama为例，在本地搭建自己的大模型服务。话不多说，正文开始。

一、Ollama 简介

官网地址：ollama官网

1、什么是Ollama

Ollama 是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计，极大地简化了大模型在本地运行的过程。对用户来说，只需要通过执行几条命令就能在本地运行开源大模型，如qwen、llama等。

2、特点：

简化部署：Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程，使得非专业用户也能方便地管理和运行这些复杂的模型。
轻量级与可扩展：作为轻量级框架，Ollama 保持了较小的资源占用，同时具备良好的可扩展性，允许用户根据需要调整配置以适应不同规模的项目和硬件条件。
API支持：提供了一个简洁的 API，使得开发者能够轻松创建、运行和管理大型语言模型实例，降低了与模型交互的技术门槛。
预构建模型库：包含一系列预先训练好的大型语言模型，用户可以直接选用这些模型应用于自己的应用程序，无需从头训练或自行寻找模型源。
跨平台支持：提供针对 macOS、Windows（预览版）、Linux 以及 Docker 的安装指南，确保用户能在多种操作系统环境下顺利部署和使用 Ollama。

二、Windows部署

1.下载

进入目录一中给出的ollama的官网，然后选择你安装的版本即可：

Windows下应该是

2.安装

windows下双击上边的exe文件，选择install安装即可.

3.测试安装

进入到cmd下，输入Ollama，出现下列内容则证明安装成功，安装成功后，该服务会开机自启，不需要每次手动运行

4.模型部署：

直接cmd命令行里输入ollama run xxx(xxx为你要部署的模型名字，如)即可。同时，大家也可以前往ollama官网查看支持的模型，如下：

在红框中搜索你想要部署的模型，如qwen2

选择模型大小，然后复制右侧命令到cmd中即可，运行成功的界面如下：

5.注意

Windows下模型默认下载到 C:\Users\%username%\.ollama\models下，如果你要更改，需要在电脑“高级环境变量”中创建一个新的变量OLLAMA_MODELS，如下：

模型将会保存在D:\ollama\models下

监听端口默认为11434，如果你要更改默认端口，同上，在环境变量中新增OLLAMA_HOST，如下：

这样修改之后，你本地请求ip:1006即可。

如果按照以上方式修改了环境变量，记得重启ollama服务，否则不会生效。

三、 Docker部署

1.docker安装

这部部分自行百度下，网上很多教程，需要注意的是，如果你电脑有gpu的话记得去安装docker的gpu版本。

2.ollama镜像拉取

docker pull ollama/ollama

3.ollama运行容器

CPU 下：

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

GPU下：

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

其中， -v ollama:/root/.ollama表示你要将本地的ollama目录挂载到容器中，该目录可自己指定，是用来存放模型的。最好自己创建下。--name. ollama为容器名，也可以自己指定

4.模型部署：

部署方式同二.4中，即直接ollama run xxx即可，x x x是你要部署的模型型号。

5.注意：

当你想使用所有的gpu时，则执行3中的命令即可，如果要指定gpu，执行下列命令：

docker run -d --gpus "device=7"  -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

如果你更改监听端口，则执行下列命令：

docker run -d --gpus=all  -v ollama:/root/.ollama -p xxx:11434 --name ollama ollama/ollama

其中，x x x即为你要监听的本机端口号

总结

以上就是本篇全部内容，后续会不定时更新该系列文章，如果觉的有用的话，别忘了三连🐶

查看全文

http://www.lryc.cn/news/392865.html

Java毕业设计基于SSM vue新生报到系统小程序微信小程序

玩转云服务：Oracle Cloud甲骨文永久免费云服务器注册及配置指南

Zabbix——宏

Unity 简单载具路线 Waypoint 导航

科普文：微服务之服务网格Service Mesh

第四十九章解决 IRIS 中的 SOAP 问题 - 发送消息时出现问题

STM32-HAL-FATFS(文件系统)(没做完，stm32f103zet6(有大佬的可以在评论区说一下次板子为什么挂载失败了))

线性代数基础概念：矩阵

【优化论】约束优化算法

7寸微型FPV无人机技术详解

大数据面试题之Presto[Trino](2)

STM32和DHT11使用显示温湿度度（代码理解）+单总线协议

EVM-MLIR：以MLIR编写的EVM

深入Django（八）

华为开发者大会2024纪要：鸿蒙OS的全新篇章与AI大模型的革命

吴恩达深度学习笔记：机器学习策略（2）(ML Strategy (2)) 2.7-2.8

云计算渲染时代：选择Blender或KeyShot进行高效渲染

html5中的iframe

海睿思问数（TableGPT）：开创企业新一代指标应用模式

LM-Cocktail：一种创新的模型合并方法打破预训练语言模型微调后的性能局限，实现语言模型在一般任务与特定领域的均衡高性能

默认导出(default)和命名导出

开发个人Go-ChatGPT--1 项目介绍

皮卡超级壁纸 | 幸运壁纸幸运壁纸app是一款涵盖了热门影视剧、动漫、风景等等资源的装饰工具，

【ARMv8/v9 GIC 系列 5.1 -- GIC GICD_CTRL Enable 1 of N Wakeup Function】

C++怎么解决不支持字符串枚举？

中英双语介绍四大会计师事务所（Big Four accounting firms）

前言

一、Ollama 简介

1、什么是Ollama

2、特点：

二、Windows部署

1.下载

2.安装

3.测试安装

4.模型部署：

5.注意

三、 Docker部署

1.docker安装

2.ollama镜像拉取

3.ollama运行容器

4.模型部署：

5.注意：

总结

相关文章：