当前位置: 首页 > news >正文

【AI】生成式AI服务器最低配置

【背景】

考虑数据安全,又想用AI赋能企业内部的日常工作,答案只有一个,本地部署。
UI采用open-web-ui,模型用Ollama管理,在局域网做成SAAS服务。要组一个服务器,提供部门内部最多30个的API并发。以下为反复比对后得到的配置。
注意,之所以是最低配置,纯粹因为公司申请花钱麻烦,所以有条件的话当然直接双GPU,A100走起,320GDDR4走起。
穷人,只能花小钱办大事。
模型都是text generation,不涉及图片和视频生成。
每个单品硬件控制在5000元以下。

【具体配置】

"英特尔(Intel) i9-14900K
"金士顿(Kingston)FURY 128GB(32G×4)套装 DDR5 6000 台式机内存条
"技嘉(GIGABYTE)风魔 GeForce RTX 4070显卡
"技嘉Z790M AORUS ELITE/小雕/耐久主板
"技嘉(GIGABYTE)C102G全景式 机箱熏黑钢化玻璃侧透兼容360/240水冷散热器
"技嘉(GIGABYTE)AORUS 冰雕一体式CPU水冷散热器
"西部数据(WD) M.2 NVME 2230 SSD固态硬盘

【注意事项】

一些基础的注意事项包括,主板看是否支持14代CPU,版型是ATX还是MATX等,机箱需要匹配。
4070是穷人搞AI最有性价比的卡。
水冷必须一体式不然维护麻烦漏液风险大。
NVM读取速度快但要注意M2接口数量。
电源要看瓦数,目前这个配置至少要750W以上。

【实际效果】

用过再补充,希望能够足够跑服务。

http://www.lryc.cn/news/385205.html

相关文章:

  • 2.Android逆向协议-了解常用的逆向工具
  • 大数据------额外软件、插件及技术------Linux(完整知识点汇总)
  • iOS 其他应用的文件如何在分享中使用自己的应用打开
  • 【编译原理必考大题】 推导构建语法树,写出语法树的短语,简单短语和句柄
  • redis服务介绍
  • nodepad 中换行符、tab替换
  • 常见的字符串函数(包含头文件string.h)和字符函数(2)
  • Python | Leetcode Python题解之第187题重复的DNA序列
  • SpringCloud分布式微服务链路追踪方案:Skywalking
  • 首次线下联合亮相!灵途科技携手AEye、ATI亮相2024 EAC 易贸汽车产业大会
  • 一文入门CMake
  • 【LeetCode面试经典150题】117. 填充每个节点的下一个右侧节点指针 II
  • RTDETR更换优化器——Lion
  • Spring Boot中最佳实践:数据源配置详解
  • 第1章 物联网模式简介---独特要求和体系结构原则
  • 数据挖掘概览
  • 【学习】软件测试中常见的文档类型及其作用
  • electron的托盘Tray
  • Harmony OS UI框架探索笔记
  • transformers evaluate
  • 【ONLYOFFICE深度探索】:ONLYOFFICE桌面编辑器8.1震撼发布,打造高效办公新境界
  • C++系统相关操作4 - 获取CPU(指令集)架构类型
  • whisper 实现语音转文字
  • 使用VLLM部署llama3量化版
  • 计算机缺失OpenCL.dll怎么办,OpenCL.dll丢失的多种解决方法
  • git 本地代码管理
  • Docker(九)-Docker运行redis6.0.8容器实例
  • 似然 与 概率
  • Tableau数据可视化与仪表盘搭建
  • web前端——HTML