当前位置: 首页 > news >正文

Llama 2 模型

非常清楚!!!Llama 2详解 - 知乎 (zhihu.com)icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/649756898?utm_campaign=shareopn&utm_medium=social&utm_psn=1754103877518098432&utm_source=wechat_session一些补充理解:

序列化:将文本进行Tokenization,将其切分成单词或字符,形成Token序列。之后将文本序列转换为索引序列(语料库中的index)    ----    sentencepiece (开源的文本Tokenzier工具)

input_tensor:[batch_size,seq_len,hidden_dim]  

batch_size:批量大小,每次处理的样本数

seq_len:句子的长度

hidden_dim:每个word映射的embedding长度

softmax

用于多类分类问题的激活函数,在多类分类问题中,超过两个类标签则需要类成员关系。对于长度为K的任意实向量,Softmax函数可以将其压缩为长度为K,值在[0,1]范围内,并且向量中元素的总和为1的实向量。

注意力机制(单头、多头)

 

Llama 2的模型结构与标准的Transformer Decoder结构基本一致,主要由32个 Transformer Block 组成,不同之处主要包括以下几点:

  1. 前置的RMSNorm
  2. Q在与K相乘之前,先使用RoPE进行位置编码
  3. K V Cache,并采用Group Query Attention
  4. FeedForward层

 

为什么不用缓存Q? maybe->当前Q会和之前KV进行计算,计算结束后就不会再使用了。

缺点:访存太慢,产生内存墙

->改进GQA(进行分组共享K、V)

http://www.lryc.cn/news/323541.html

相关文章:

  • SQLiteC/C++接口详细介绍sqlite3_stmt类(十一)
  • 【理解机器学习算法】之Clustering算法(Agglomerative Clustering)
  • 千帆AppBuilder开发参考-应用API调用说明
  • python自定义日历库,与对应calendar库函数功能基本一致
  • css3鼠标悬停图片特效,图片悬停效果源码
  • 使用CSS3画出一个叮当猫HTML源码
  • Spring Boot 自动化单元测试类的编写过程
  • 复试专业前沿问题问答合集8-3——RNN、Hadoop、GPT大语言模型
  • 序列的使用
  • golang kafka sarama 源码解析
  • Flutter知识点整理
  • 现代游戏引擎架构
  • 深度学习:复杂工业场景下的复杂缺陷检测方法
  • CSDN个人简介优化 html font属性
  • 从哈希桶角度看 unordered_map 与 unordered_set 的实现
  • 飞天使-k8s知识点27-kubernetes温故知新2-deployment
  • 手机网页关键词视频爬虫采集软件可导出视频分享链接|视频无水印批量下载工具
  • 基于OpenCV的图像处理案例之图像矫正(Python)
  • 创建linux虚拟机系统:(安装Ubuntu镜像文件,包含语言设置、中文输入法、时间设置)
  • 3.0 V-22V 宽输入电压,高效率异步升压芯片-ZCC5429
  • Sphinx + Readthedocs 避坑速通指南
  • IPP-7010 表面贴装 90 度混合耦合器
  • 25.2 微服务Dubbo
  • CI/CD环境搭建
  • API调试管理工具Postman下载及操作介绍
  • vue集成百度地图,实现关键字搜索并自定义覆盖物,保存成静态图片
  • Java中的Stream流
  • 前端UI怎么防止用户反复提交?
  • OpenHarmony游戏应用程序-实现的一个手柄游戏
  • Redis+Lua脚本+SpringAOP实现接口限流