当前位置：首页 > news >正文

transformer与神经网络

news 2025/8/5 8:02:35

一.神经网络

1.卷积神经CNN：适合处理图像，计算机视觉领域

2.循环神经RNN：存储序列数据，记住过去的信息应用到当前处理过程中，序列不能太长

3.长短时记忆网络LSTM：特殊的RNN，RNN的改进版本，能够更好捕捉长距离依赖关系

4.transformer

（1）并行计算

（2）捕捉长距离依赖

（3）可扩展性

（4）灵活性和效果

二.transformer工作原理

1.原理图

2.Transformer模型的生成过程可以分为以下4个步骤：

（1）分词（Tokenization）：token大模型中的最基本的处理单元

1）把汉字拆成积木（从前 / 国王 / 女儿）

（2）词嵌入（Embedding）：矩阵计算

（3）注意力机制（Attention Mechanism）：捕捉词之间的关联程度

1）编码器处理：分析问题，用注意力划重点（国王和女儿的关系等）

2）解码器处理：边编故事边查表，用注意力确保连贯

（4）最终的内容生成（Content Generation）：输出结果

http://www.lryc.cn/news/609746.html

相关文章：

ubuntu24.01安装odoo18

纯前端使用ExcelJS插件导出Excel

计算机视觉（2）车规摄像头标准

5天挑战网络编程 -DAY1（linux版）

python:讲懂决策树，为理解随机森林算法做准备，以示例带学习，通俗易懂，容易理解和掌握

句子表征-文本匹配--representation-based/interactive-based

学习日志27 python

基于开源AI智能名片链动2+1模式与S2B2C商城小程序的直播营销销量转化机制研究

短剧小程序系统开发：引领影视消费新潮流

【世纪龙科技】汽车自动变速器拆装虚拟实训软件

音视频文案字幕一键提取，免费使用，效率软件！

AR远程协作网页设计：虚实融合场景下的故障标注与操作指引界面

AR技术赋能轨道交通培训：虚实结合提升学习效率

AUTOSAR AR-Explorer正式发布

6s081环境配置以及使用vscode连接本地wsl2

Qt 使用QtXlsx库处理Excel文件

AR技术赋能能源勘探：从数据可视化到智能预测的革命性突破

《解构Angular组件变化检测：从自动到手动的效能突破》

【Git 误操作恢复指南】

如何安装 nvm-setup.exe？Windows 安装 NVM 管理 Node.js 版本的完整流程（附安装包下载）

配置Mybatis环境

ollama解锁LLM生成上下文长度

墨者学院SQL过滤字符后手工绕过漏洞测试(万能口令)

Lifelong Learning and Selective Forgetting via Contrastive Strategy

深度学习图像处理篇之AlexNet模型详解

docker镜像源配置教程，以及解决安装好docker配置镜像源后，出现报错。Job for docker.service failed

洛谷做题11：P1424 小鱼的航程（改进版）

Android Espresso 测试框架深度解析：从入门到精通

GCC与AI：编译优化新革命

PHP进阶语法详解：命名空间、类型转换与文件操作