当前位置: 首页 > news >正文

llama3.1本地部署方式

llama3.1 资源消耗情况

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析



70B版本,FP16+16K token需要的资源约为75G;FP16+128K token需要的资源约为110G



1、ollama

ollama工具部署及使用:

https://github.com/ollama/ollama/blob/main/README.md#quickstart

ollama工具支持模型:

https://ollama.com/library

开放IP (配置修改教程):

阿里云Linux服务器安装Ollama后,IP无法访问_ollama ip-CSDN博客

第二十六篇-Ollama-监听本地IP与端口_ollama 修改端口-CSDN博客



开源模型地址:

https://github.com/meta-llama/llama-models/blob/main/README.md



2、modelscope

模型文件:

魔搭社区

使用方式:

魔搭社区



http://www.lryc.cn/news/425530.html

相关文章:

  • 相机光学(三十四)——色差仪颜色观察者视角
  • 思二勋:web3.0是打造应对复杂市场敏捷组织的关键
  • 一文带你快速了解——HAProxy负载均衡
  • 【C++高阶】哈希—— 位图 | 布隆过滤器 | 哈希切分
  • 启发式算法之模拟退火算法
  • 编码器汇总:光学编码器,霍尔编码器,磁性编码器,电容式编码器,单圈编码器,多圈编码器,增量式编码器,绝对值式编码器等
  • 有哪些性价比高的蓝牙耳机可入?四款百万好评实力品牌推荐!
  • MySQL数据库——表的CURD(Update)
  • 性能测试 —— linux服务器搭建JMeter+Grafana+Influxdb监控可视化平台!
  • python基础命令学习
  • 程序设计基础(试题及答案)
  • 日常收录资源
  • 索引——电子学
  • 【学习笔记】A2X通信的协议(九)- 广播远程ID(BRID)
  • HoloLens 和 Unity 空间坐标系统
  • 【npm】如何将开发的vite插件发布到npm
  • 数据结构-查找
  • Ubuntu环境下 pip安装应用时报错
  • 打包时未添加camera模块,请参考https://ask.dcloud.net.cn/arss/1ooticle/283
  • Vue3+Setup使用websocket
  • tcpdump快速入门及实践手册
  • javascript双判断语句
  • C# 中的多态
  • 高性能内存对象缓存Memcached原理与部署
  • 【C++进阶】map与set的封装实践
  • 可视化编程-七巧低代码入门02
  • 算法:魔法字典
  • html+css 实现hover 翻转按钮
  • ETL程序员如何平衡日常编码工作与提升式学习
  • 被嫌弃的35岁程序员,竟找到了职业的新出路:PMP项目管理