当前位置: 首页 > news >正文

2025秋招NLP算法面试真题(一)-史上最全Transformer面试题

史上最全Transformer面试题

  1. Transformer为何使用多头注意力机制?(为什么不使用一个头)
  2. Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘?
    (注意和第一个问题的区别)
  3. Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别?
  4. 为什么在进行softmax之前需要对attention进行scaled(为什么除以dk的平方根),并使用公式推导进行讲解
  5. 在计算attention score的时候如何对padding做mask操作?
  6. 为什么在进行多头注意力的时候需要对每个head进行降维?(可以参考上面一个问题)
  7. 大概讲一下Transformer的Encoder模块?
  8. 为何在获取输入词向量之后需要对矩阵乘以embedding size的开方?意义是什么?
  9. 简单介绍一下Transformer的位置编码?有什么意义和优缺点?
  10. 你还了解哪些关于位置编码的技术,各自的优缺点是什么?
  11. 简单讲一下Transformer中的残差结构以及意义。
  12. 为什么transformer块使用LayerNorm而不是BatchNorm?LayerNorm 在Transformer的位置是哪里?
  13. 简答讲一下BatchNorm技术,以及它的优缺点。
  14. 简单描述一下Transformer中的前馈神经网络?使用了什么激活函数?相关优缺点?
  15. Encoder端和Decoder端是如何进行交互的?(在这里可以问一下关于seq2seq的attention知识)
  16. Decoder阶段的多头自注意力和encoder的多头自注意力有什么区别?(为什么需要decoder自注意力需要进行 sequence mask)
  17. Transformer的并行化提现在哪个地方?Decoder端可以做并行化吗?
  18. 简单描述一下wordpiece model 和 byte pair encoding,有实际应用过吗?
  19. Transformer训练的时候学习率是如何设定的?Dropout是如何设定的,位置在哪里?Dropout 在测试的需要有什么需要注意的吗?
  20. 引申一个关于bert问题,bert的mask为何不学习transformer在attention处进行屏蔽score的技巧?
http://www.lryc.cn/news/380586.html

相关文章:

  • 基于STM32的智能家居安防系统
  • React+TS前台项目实战(十二)-- 全局常用组件Toast封装,以及rxjs和useReducer的使用
  • 總結光學(完)
  • 线程C++
  • DAMA学习笔记(二)-数据治理
  • 07-appium常用操作
  • 使用lua开发apisix自定义插件并发布
  • 43 mysql insert select 的实现
  • 趣味学Python,快速上手神奇的itertools库!
  • 富文本编辑器CKEditor
  • 【机器学习】音乐大模型的深入探讨——当机器有了创意,是机遇还是灾难?
  • 机器人学习和研究的物质基础包含哪些内容?
  • Python中的交互式GUI开发:与MATLAB uicontrol的比较
  • js 实现将后端请求来的 Blob 数据保存到用户选择的任意目录
  • 【LLM之RAG】RAT论文阅读笔记
  • windows anaconda 安装 Labelme
  • Python实现基于深度学习的电影推荐系统
  • C++ (week9):Git
  • Seaborn:数据可视化的强大工具
  • 图解注意力
  • Typora Markdown编辑器 for Mac v1.8.10 安装
  • 代码随想录算法训练营Day46|动态规划:121.买卖股票的最佳时机I、122.买卖股票的最佳时机II、123.买卖股票的最佳时机III
  • hive on spark 记录
  • 【计算机网络体系结构】计算机网络体系结构实验-DHCP实验
  • 攻防世界-pdf
  • 关于后端幂等性问题分析与总结
  • 2024广东省职业技能大赛云计算赛项实战——容器云平台搭建
  • 手持弹幕LED滚动字幕屏夜店表白手灯接机微信抖音小程序开源版开发
  • 红队内网攻防渗透:内网渗透之内网对抗:代理通讯篇无外网或不可达SockS全协议规则配置C2正反向上线解决方案
  • PHP学习总结-入门篇