当前位置: 首页 > news >正文

大模型显存占用分析

kvcache显存占用分析

假设序列输入长度:s,输出长度:n,数据类型以FP16来保存KV cache。
峰值显存占用:b(s+n)hl2*2=4blh(s+n)
注:b表示batch size,第一个2表示k/v cache,第二个2表示FP16占2字节。

例:GPT3-175B,模型占用显存:350G(FP16),层数l为96,维度h为12888。

batch_sizes+nKV cache(G)KV cache/weight
44096810.23
http://www.lryc.cn/news/330259.html

相关文章:

  • matlab中旋转矩阵函数
  • 探讨Spring Boot的自动配置原理
  • 【LeetCode】热题100 刷题笔记
  • 基于springboot+vue+Mysql的火车订票管理系统
  • C#学习笔记 面试提要
  • Linux用户识别与身份验证命令一览
  • 【Linux】GCC编译器(七)
  • 【目录整理】(五)
  • 项目:USB键盘和鼠标的复合设备
  • Linux利用Jenkins部署SpringBoot项目保姆级教程
  • elementUI 输入框按回车刷新页面问题
  • C++的字节对齐
  • ALPHA开发板上的PHY芯片驱动:LAN8720驱动
  • C语言游戏实战(9):球球大作战
  • 【Windows】关闭自动更新
  • mac如何检测移动硬盘 mac硬盘检测工具 Tuxera怎么用 Tuxera NTFS官网
  • 1038 Recover the Smallest Number
  • 【Go】四、包名、访问范围控制、标识符、运算符
  • 达梦数据库日志文件管理
  • zookeeper 监控 与 JVM 设置
  • 【java】关于String、StringBuffer和StringBuilder的那些事
  • Spring 的 Ioc配置
  • 基于Java-SpringBoot+vue实现的前后端分离信息管理系统设计和实现
  • 用Python实现办公自动化(自动化处理PDF文件)
  • 银河麒麟操作系统Kylin Linux 离线安装Nginx1.21.5
  • ApiFox 使用教程
  • github拉取的项目添加至自己的仓库
  • ZooKeeper 的持久化机制
  • VS2022+QT5.9 提示找不到qtmain.lib
  • HTTP和HTTPS谁传输数据更安全?