当前位置: 首页 > news >正文

Transformer 面试题及详细答案120道(61-70)-- 解码与生成

前后端面试题》专栏集合了前后端各个知识模块的面试题,包括html,javascript,css,vue,react,java,Openlayers,leaflet,cesium,mapboxGL,threejs,nodejs,mangoDB,SQL,Linux… 。

前后端面试题-专栏总目录

在这里插入图片描述

文章目录

  • 一、本文面试题目录
      • 61. 什么是“贪婪解码(Greedy Decoding)”?它的优缺点是什么?
        • 原理说明
        • 示例代码(基于PyTorch)
      • 62. 束搜索(Beam Search)的原理是什么?如何选择束宽(Beam Size)?
        • 原理说明
        • 示例代码(基于PyTorch)
      • 63. 采样(Sampling)在生成任务中的作用是什么?温度参数(Temperature)如何影响采样结果?
        • 原理说明
        • 示例代码(基于PyTorch)
      • 64. 什么是“top-k采样”和“nucleus sampling(top-p采样)”?它们如何解决采样的随机性问题?
        • 原理说明
        • 示例代码(top-p采样,基于PyTorch)
      • 65. 解码过程中,如何避免生成重复的内容?
        • 原理说明
        • 示例代码(n-gram惩罚,基于PyTorch)
      • 66. Transformer在生成长序列时可能遇到哪些问题?如何缓解?
        • 原理说明
        • 示例代码(分段处理长序列)
      • 67. 对比解码(Contrastive Decoding)的思想是什么?它能提升生成质量吗?
        • 原理说明
        • 示例代码(对比解码简化版)
      • 68. 什么是“长度惩罚(Length Penalty)”?在束搜索中如何使用?
        • 原理说明
        • 示例代码(带长度惩罚的束搜索)
      • 69. 生成任务中,如何评估Transformer的输出质量(如BLEU、ROUGE指标)?
        • 原理说明
        • 示例代码(使用NLTK计算BLEU)
      • 70. 简述Transformer在实时生成任务(如对话系统)中的延迟问题及优化方法。
        • 原理说明
        • 优化方法
        • 示例代码(量化推理示例,基于PyTorch)
  • 二、120道Transformer面试题目录列表

一、本文面试题目录

61. 什么是“贪婪解码(Greedy Decoding)”?它的优缺点是什么?

原理说明

贪婪解码是Transformer生成序列时最直接的解码策略,其核心逻辑是:在每一步生成时,从模型预测的所有可能token中选择概率最高的那个作为当前输出,然后将该token加入已生成序列,再基于新序列预测下一个token,重复此过程直到生成结束符(如<END>)或达到最大长度。

  • 优点
http://www.lryc.cn/news/624019.html

相关文章:

  • Spring IOC 学习笔记
  • Spring 创建 Bean 的 8 种主要方式
  • Vue3 中的 ref、模板引用和 defineExpose 详解
  • 数据结构初阶(18)快速排序·深入优化探讨
  • 【深度学习-基础知识】单机多卡和多机多卡训练
  • oom 文件怎么导到visualvm分析家
  • 生成模型实战 | InfoGAN详解与实现
  • 停车位 车辆
  • AI出题人给出的Java后端面经(十七)(日更)
  • 【URP】[法线贴图]为什么主要是蓝色的?
  • YoloV9改进策略:Block改进-DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性-即插即用
  • LangChain4j
  • Java 学习笔记(基础篇4)
  • C++零拷贝网络编程实战:从理论到生产环境的性能优化之路
  • JavaScript 性能优化实战:从评估到落地的全链路指南
  • SparkSQL性能优化实践指南
  • 第16节:自定义几何体 - 从顶点构建3D世界
  • 【FreeRTOS】刨根问底6: 应该如何防止任务栈溢出?
  • 【网络安全】Webshell的绕过——绕过动态检测引擎WAF-缓存绕过(Hash碰撞)
  • 什么是GD库?PHP中7大类64个GD库函数用法详解
  • 日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(3):21-30语法
  • 【AI论文】序曲(PRELUDE):一项旨在考察对长文本语境进行全局理解与推理能力的基准测试
  • PHP静态类self和static用法
  • 6-服务安全检测和防御技术
  • Tomcat Service 服务原理
  • Coin与Token的区别解析
  • java八股文-(spring cloud)微服务篇-参考回答
  • C语言基础:(十六)深入理解指针(6)
  • Centos 更新/修改宝塔版本
  • Rust 入门 生命周期(十八)