当前位置: 首页 > news >正文

搭建大模型

环境:在闪电算力云上申请的3090显卡、ubuntu 22.04,安装了显卡驱动、cuda(11.8)、cdunn(8.9.7)、ollama(0.9.6),使用 ollama 下载 deepseek-llm:7b大模型并运行

1、申请算力云,我用的闪电算力云:登录

      登录后在 云实例中 租用新的实例,我选择的 3090,ubuntu 22.04 纯净版,一块钱一个小时;

  实例申请后自动启动,在一键链接中可以看到 连接信息,使用 ftp工具进行连接;

  实例在运行就就会收费,不需要运行的时候记得关机,否则会一直收费;

2、环境搭建

        1、安装 gpu 驱动并重启

                    sudo ubuntu-drivers autoinstall  
                    sudo reboot 
    
                    验证驱动是否安装成功
                       nvidia-smi    能输出驱动版本号

        2、添加镜像源

              sudo sed -i "s|http://.*archive.ubuntu.com|https://mirrors.aliyun.com|g" /etc/apt/sources.list    

        3、安装 cuda 存储库

               (1)、查看是否有cuda存储库
                        ls /etc/apt/sources.list.d/ | grep cuda
               (2)、安装 cuda 存储库(本地环境是 ubuntu22.04,根据自己的需要选择存储库)    
        wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb    
        sudo dpkg -i cuda-keyring_1.1-1_all.deb
        sudo apt update

         4、安装 cuda 

                   (1)、安装:sudo apt install -y cuda-toolkit-11-8
                   (2)、配置环境变量
                        echo 'export PATH=/usr/local/cuda-11.8/bin:$PATH' >> ~/.bashrc
                        echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
                        source ~/.bashrc
                   (3)、验证是否安装成功
                        nvcc --version

         5、安装cudnn

                 (1)、添加秘钥  sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub

                 (2)、添加存储库
        sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ /"
        sudo apt update      如果出现重复警告,使用步骤6删除重复


        
                 (3)、查看cudnn 和 cuda版本对应关系,这里使用 cudnn 8.9.7 
           apt-cache madison libcudnn8 libcudnn8-dev
          
                 (4)、安装cudnn  
        sudo apt install -y libcudnn8=8.9.7.*-1+cuda11.8 \
                   libcudnn8-dev=8.9.7.*-1+cuda11.8      
                   
                 (5)、验证是否安装成功   
            cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
            
                    正常输出
                        #define CUDNN_MAJOR 8
                        #define CUDNN_MINOR 9
                        #define CUDNN_PATCHLEVEL 7 

        6、删除重复存储库(非必须,在步骤5中出现重复的情况下执行)

                 1、查看两个源是否重复

                     cat /etc/apt/sources.list.d/archive_uri-https_developer_download_nvidia_com_compute_cuda_repos_ubuntu2204_x86_64_-jammy.list
                     cat /etc/apt/sources.list.d/cuda-ubuntu2204-x86_64.list 
     如果都输出了                https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ 
     则删除一个存储库
         sudo rm /etc/apt/sources.list.d/archive_uri-https_developer_download_nvidia_com_compute_cuda_repos_ubuntu2204_x86_64_-jammy.list
    
                再次执行步骤5中的 sudo apt update 就不应该再警告重复    

        7、安装 ollama,使用(2)中的加速器方法

                 (1)、从官网安装,速度非常慢,最少两个小时而且网络不稳定,下载过程中可能会断开,不推荐
        curl -fsSL https://ollama.com/install.sh | sh
        chmod +x install.sh
        ./install.sh

    
                (2)、使用加速器 gh.ddlc.top 下载安装,速度提升20倍以上,如果 gh.ddlc.top 不可用可以换个加速器
       export OLLAMA_MIRROR="https://gh.ddlc.top/https://github.com/ollama/ollama/releases/latest/download"
       curl -fsSL https://ollama.com/install.sh | sed "s|https://ollama.com/download|$OLLAMA_MIRROR|g" | sh
       
   启动 ollama 服务
       ollama serve &

          8、使用 ollama 安装 大模型

                (1)、下载模型:
                        ollama pull deepseek-llm:7b


                 (2)、运行模型:
                        ollama run deepseek-llm:7b    

  

http://www.lryc.cn/news/594212.html

相关文章:

  • 安卓 Termux.apk
  • SaTokenException: 未能获取对应StpLogic 问题解决
  • 【Lua】多脚本引用
  • cmake语法学习笔记
  • SpringBoot3集成MapstructPlus
  • JMeter连接数据库
  • 数字图像处理(四:图像如果当作矩阵,那加减乘除处理了矩阵,那图像咋变):从LED冬奥会、奥运会及春晚等等大屏,到手机小屏,快来挖一挖里面都有什么
  • FFmpeg 图片处理
  • Hadoop小文件合并技术深度解析:HAR文件归档、存储代价与索引结构
  • 7-大语言模型—指令理解:指令微调训练+模型微调
  • client-go: k8s选主
  • 【Settlement】P1:整理GH中的矩形GRID角点到EXCEL中
  • macOs上交叉编译ffmpeg及安装ffmpeg工具
  • Facebook 开源多季节性时间序列数据预测工具:Prophet 饱和预测 Saturating Forecasts
  • lvs调度算法(10种)
  • DOM型XSS破坏
  • MySQL锁(二) 共享锁与互斥锁
  • pages.json页面路由中,globalStyle的各个属性
  • 两个数据表的故事:第 1 部分
  • 测试中的bug
  • LVS-----TUN模式配置
  • 20250720-6-Kubernetes 调度-nodeName字段,DaemonS_笔记
  • Pinia 核心知识详解:Vue3 新一代状态管理指南
  • spring-cloud使用
  • 【数据结构】揭秘二叉树与堆--用C语言实现堆
  • 数据结构-线性表顺序表示
  • PrimeTime:高级片上变化(AOCV)
  • 小红书 MCP 服务器
  • Vue 3中reactive、ref、watchEffect和watch的底层原理及核心区别解析
  • SQL189 牛客直播各科目同时在线人数