当前位置: 首页 > news >正文

计算资源消耗

计算资源消耗

计算资源的消耗分成:

  1. 模型参数本身的存储。
  2. 模型参数的梯度以及梯度momentum的存储。
  3. token的传播过程

例如以llama3-7b为例:

  1. 模型参数存储: 模型参数量 * fp32
    • 例如llama3-70b为例,7 * 10^9 * 4
  2. 模型参数的梯度以及momentum存储:模型参数量 * fp32 ; 模型参数量 * fp32
  3. activition : 一个batch的token数量* embed维度 * 传播层数 * fp32
http://www.lryc.cn/news/423017.html

相关文章:

  • 企业微信推送消息的Java实现教程
  • 强化学习之Actor-Critic算法(基于值函数和策略的结合)——以CartPole环境为例
  • Linux学习记录(五)-------三类读写函数
  • 2024年8月13日(lvs NAT脚本 RS脚本 ds脚本)
  • css实现水滴效果图
  • 接口测试面试题目,你都会了吗?
  • jmeter-beanshell学习16-自定义函数
  • LogicFlow工作流在React和Vue3中的使用
  • Python循环语句:不到长城心不死
  • Unity教程(九)角色攻击的改进
  • 宠物空气净化器真的能除毛吗?有哪些选购技巧和品牌推荐修改版
  • Qt自定义注释
  • 【模电笔记】——信号的运算和处理电路(含电压比较器)
  • Java之 equals()与==
  • Ubuntu20.04 运行深蓝路径规划hw1
  • 企业如何组建安全稳定的跨国通信网络
  • WordPress原创插件:Download-block-plugin下载按钮图标美化
  • 前端【详解】缓存
  • P5821 【LK R-03】密码串匹配
  • httpx,一个网络请求的 Python 新宠儿
  • 计算机网络408考研 2014
  • JavaScript 资源大全中文版
  • 如何获取能直接在浏览器打开的播放地址?
  • 如何用 LangChain 实现一个Zero Shot智能决策器(附源码)
  • 读完这本书,我终于搞懂了Transformer、BERT和GPT!【附PDF】
  • 仿RabbitMq简易消息队列基础篇(Muduo库的使用)
  • .net SqlSugarHelper
  • “AI能不能代替某某职业”,到底谁在破防?
  • 智慧图书馆:构建高效视频智能管理方案,提升图书馆个性化服务
  • React快速开发框架