当前位置: 首页 > news >正文

LLM run

  • lmstudio
    lmstudio

  • ollama
    ollama

  • N 卡使用自带UI gpu加速推理 ,选择满足条件的,

  • ds模型选择列表
    https://ollama.com/library/deepseek-r1

  • a卡当前支持的显卡型号
    在这里插入图片描述

  • I卡 gpu加速配置

  • 2025.3 intel Official project optimization
    https://www.modelscope.cn/models/ipexllm/ollama-ipex-llm#Windows-%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97

anaconda + pip ipex-llm是愚蠢的废弃方案

  • 清理无用的pip所下载包
pip list
pip uninstall 包名# 删除所有已安装的包
# window environment need download this
pip freeze | % {pip uninstall -y $_}
pip freeze | ForEach-Object { pip uninstall -y $_ }
  • ipex-llm
    https://github.com/intel/ipex-llm
  • anaconda
    anaconda
    在这里插入图片描述
  • py
    py
    在这里插入图片描述

https://zhuanlan.zhihu.com/p/25124843480

http://www.lryc.cn/news/547680.html

相关文章:

  • k8s面试题总结(十)
  • android中activity1和activity2中接收定时消息
  • Non-Homophilic Graph Pre-Training and Prompt Learning
  • Ollama 框架本地部署教程:开源定制,为AI 项目打造专属解决方案!
  • unittest框架 核心知识的系统复习及与pytest的对比
  • vue面试宝典之二
  • ESLint 深度解析:原理、规则与插件开发实践
  • 洛谷P1091
  • 随机树算法 自动驾驶汽车的路径规划 静态障碍物(Matlab)
  • 江科大51单片机笔记【9】DS1302时钟可调时钟(下)
  • ssm_mysql_暖心家装平台
  • 一周学会Flask3 Python Web开发-SQLAlchemy简介及安装
  • < 自用文儿 > DELETED 设置速读 in Ubuntu24
  • 自动化同步多服务器数据库表结构
  • 深入理解 HTML 元素:构建网页的基础
  • 黄昏时间户外街拍人像Lr调色教程,手机滤镜PS+Lightroom预设下载!
  • OCPP扩展机制与自定义功能开发:协议灵活性设计与实践 - 慧知开源充电桩平台
  • 哈希查找与深度优先遍历深度解析
  • 【powerjob】 powerjobserver注册服务IP错误
  • Flutter底层实现
  • 亚信安全发布2024威胁年报和2025威胁预测
  • 【YOLOv12改进trick】StarBlock引入YOLOv12,创新涨点优化,含创新点Python代码,方便发论文
  • Android MVI架构模式详解
  • Spring AI Alibaba + Ollama:国产大模型DeepSeek LLM的低成本AI应用开发认知
  • 《2025软件测试工程师面试》功能测试篇
  • 蓝桥杯2024年第十五届省赛真题-传送阵
  • 非线性优化--NLopt算法(Android版本和Python示例)
  • 2025-03-06 ffmpeg提取SPS/PPS/SEI ( extradata )
  • 海量数据融合互通丨TiDB 在安徽省住房公积金监管服务平台的应用实践
  • 深入解析 supervision 库:功能、用法与应用案例