当前位置: 首页 > news >正文

极智AI | 大模型优化之KV Cache

欢迎关注我的公众号 [极智视界],获取我的更多经验分享

大家好,我是极智视界,本文来介绍一下 大模型优化之KV Cache。

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:https://t.zsxq.com/0aiNxERDq

在大模型的优化中经常会听到的一个技术叫 KV Cache,要理解这个技术需要你有基本的大模型概念以及 Transformer 基础。KV Cache 的全称是 key-value cache,可以简单理解为对大模型推理过程中的 key-value 缓存的优化。如果不对大模型推理过程中的 key-value 缓存进行优化,它会随着对话的增加而不断增加,也就是所占用的内存会不断动态增加,而且这种动态内存增加是不太可控的,这就像软件里的内存溢出一样。不去做 KV Cache,会对大规模推理造成几个压力:(1) 频繁的开辟增加内存;(2) 内存很快就不够用了;(3) 增加了很多冗余矩阵计算量。所以进行 KV 缓存优化是大规模训练、推理里很重要的一个环节。KV Cache 采用以空间换时间的思想,复用上次推理的 KV 缓存,可以极大降低内存压力、提高推理性能,而且不会影响任何计算精度。

以 GPT 为代表的一个 token 一个 token 往外蹦的 AIGC 大模型为例,里面最主要的结构就是 transformer 中的 self-attention 结构的堆叠,实质是将之前计算过的 key-val

http://www.lryc.cn/news/186648.html

相关文章:

  • Android 使用 registerForActivityResult() 打开系统相册或相机获取图像
  • 如何制作网页 ico
  • golang gorm 增删改查以及使用原生SQL(以操作mysql为例)
  • 代码随想录 单调栈part2
  • 详解利用高斯混合模型拆解多模态分布 + 精美可视化
  • 排序算法之【归并排序】
  • Qt中QTimer定时器的用法
  • vue-组件定义注册使用
  • 斑馬打印機打印中文
  • (一)Apache log4net™ 手册 - 介绍
  • 基于Java的民宿管理系统设计与实现(源码+lw+部署文档+讲解等)(民宿预约、民宿预订、民宿管理、酒店预约通用)
  • 039:mapboxGL更换地图上的鼠标样式
  • 【云原生】K8S对外服务之Ingress
  • 分布式锁如何实现
  • Mysql存储-EAV模式
  • 全局变量报错:\Output\STM32.axf: Error: L6218E: Undefined symbol
  • 算法错题簿(持续更新)
  • 基于Springboot实现疫情网课管理系统项目【项目源码+论文说明】
  • Linux文件与目录的增删改查
  • JVM的内存模型
  • 数据采集项目之业务数据(三)
  • vuedraggable影响点击事件的解决办法
  • Linux 中的 grep 命令
  • 阶段五-Day03-Ajax
  • EPOLL单线程版本 基于reactor 的 httpserver文件下载 支持多个客户端同时处理
  • uniapp实现微信小程序隐私协议组件封装
  • 【Node.js】NPM 和 package.json
  • 周总结【java项目】
  • 《深度不确定条件下的决策:从理论到实践》PDF
  • 【MySQL】表的基础增删改查