当前位置：首页 > news >正文

【华为昇腾|CUDA】服务器A6000显卡部署LLM实战记录

news 2025/7/9 8:22:06

安装驱动

https://www.nvidia.cn/drivers/lookup/
搜索对应gpu的kylin版本即可
先使用wget 下载rpm包
rpm -i 安装
最后使用dnf install nvidia-driver即可
- 上面安装的是驱动仓库

安装CUDA

kylin服务器参考配置
同上，先wget，后rpm -i，最后dnf install cuda即可

安装Ollama

ollama官方提供aarch64 docker，按照https://hub.docker.com/r/ollama/ollama文档操作即可

启动Ollama

同样按文档--gpus=all使用gpu资源启动容器

在启动后建议：

先docker exec -it ollama bash进入下容器
运行nvidia-smi，重点查看cuda是否正确显示版本号
- 错误则显示N/A
一般看到cuda版本号ollama即可正常使用gpu推理

查看全文

http://www.lryc.cn/news/582543.html

RISC-V：开源芯浪潮下的技术突围与职业新赛道（一）为什么RISC-V是颠覆性创新？

Redis常用数据结构以及多并发场景下的使用分析：Sorted List类型

算法设计与分析知识总结

【Python-GEE】如何利用Landsat时间序列影像通过调和回归方法提取农作物特征并进行分类

Paimon本地表查询引擎LocalTableQuery详解

DVWA靶场通关笔记-SQL盲注(SQL Injection Blind Medium级别)

【Mac】实现Docker下载安装【正在逐步完善】

hmall学习

Apollo源码架构解析---附C++代码设计示例

基于odoo17的设计模式详解---命令模式

如何快速分析光伏电站气象数据？

没合适的组合wheel包，就自行编译flash_attn吧

云原生技术与应用-容器技术技术入门与Docker环境部署

【RL+空战】学习记录01：jsbsim 仿真环境初次学习，F16 战机起飞

吃透二分法的模板解法（适合所有类似于二分的算法题）

【OceanBase 诊断调优】—— SQL 查询触发笛卡尔积怎么处理

Proface触摸屏编程软件介绍及下载

H3初识——入门介绍之常用中间件

vue前置知识-end

Vue 整合 Vue Flow：从零构建交互式流程图

理解大模型智能体生态：从 Prompt 到 Agent 的完整信息流解析

LeetCode 1248.统计优美子数组

【读代码】GLM-4.1V-Thinking：开源多模态推理模型的创新实践

大模型面试:如何解决幻觉问题

【python】pyserial 在windows 下卡住的bug

在PPT的文本框中,解决一打字,英文双引号就变成中文了

安装驱动

安装CUDA

安装Ollama

启动Ollama

相关文章：