
1.确认硬件与环境
- 检查服务器硬件是否与华为昇腾显卡兼容。确保主板具备合适的 PCI - Express 插槽,且服务器电源功率能满足显卡及其他硬件的需求。不同型号的昇腾显卡功耗有所不同,例如昇腾 310 芯片的功耗相对较低,而昇腾 910 芯片的功耗较高,需依据具体显卡型号合理匹配电源。
- 准备兼容的操作系统,如华为欧拉操作系统(openEuler),或其他经过华为认证支持昇腾显卡的 Linux 发行版。不同的操作系统版本对显卡驱动和相关软件的支持程度可能存在差异,建议选择官方推荐的版本。
2.安装显卡驱动与 CANN
- CANN:前往华为昇腾官网(https://ascend.huawei.com/ ),根据显卡型号和操作系统版本,下载对应的显卡驱动和 CANN(Compute Architecture for Neural Networks)软件包。CANN 是华为为昇腾 AI 处理器打造的全场景 AI 计算架构,包含了编译器、运行时库、优化器等一系列工具,对模型训练的性能和效率至关重要。
- :以在 Linux 系统下安装为例,解压下载的驱动压缩包,进入解压后的目录,执行安装脚本。通常可通过命令行输入 “sudo sh install.sh”(具体命令依据实际安装包说明)来启动安装过程。安装过程中,按照提示进行操作,如接受许可协议、选择安装路径等。安装完成后,可通过 “npu-smi info” 命令查看显卡状态,若能正确显示显卡信息,则表明驱动安装成功。
- CANN:解压 CANN 安装包,进入安装目录,运行安装脚本。安装过程中,可根据实际需求选择安装组件,如基础运行时库、开发工具等。安装完成后,需要配置环境变量,将 CANN 的 bin 目录和 lib 目录添加到系统的 PATH 和 LD