当前位置: 首页 > news >正文

大模型生成的常见Top-k、Top-p、Temperature参数

参考:
https://zhuanlan.zhihu.com/p/669661536

在这里插入图片描述

topK,topP

https://www.douyin.com/video/7380126984573127945

主要是softmax产生的词表每个词的概率分布后,
topK,比如K=3,表示采样概率最大的前3个,其他全部舍弃,在这前3个词选择
topP,P比如P=0.7,表示采样前面概率最大的加和>=0.7的所有词,后续在这些词中进行再选择,其他舍弃

综合下来:topP一般给后续选择的空间比topK要多些

Temperature

https://www.douyin.com/video/7380324563369889061

主要是在改变 softmax 生成解码token的概率上(所有词表每个词的可能概率):
正常softmax
在这里插入图片描述

加速Temperature后的softmax
每个指数除以t;e是自然是约等于2.7
在这里插入图片描述

T大于1,越大 softmax生成的每个词的概率差别不大,所以更随机
T小于1,越小 softmax生成的每个词的概率差别大,所以更确认,就是少部分几个词的概率最大
在这里插入图片描述

http://www.lryc.cn/news/374163.html

相关文章:

  • ppt添加圆角矩形,并调整圆角弧度方法
  • 测评要求+基本措施+对应产品
  • 什么是git?
  • C/C++中内存开辟与柔性数组
  • 编程App软件优化是什么
  • 爱了爱了,11款超良心App推荐!
  • Linux基础指令(二)(文件、权限等)
  • 爆火的治愈系插画工具又来了,额度居然有18w,根本花不完?
  • Qt 实战(4)信号与槽 | 4.3、信号连接信号
  • Day 16:3040. 相同分数的最大操作数目II
  • Go基础编程 - 07 - 字典(map)及其约束
  • WebSocket 快速入门 与 应用
  • 使用Spring Cloud设计电商系统架构
  • 揭开 Docker 容器的神秘面纱:深入理解容器原理
  • Elasticsearch:Open Crawler 发布技术预览版
  • C 语言连接MySQL 数据库
  • 【探索Linux】P.34(HTTPS协议)
  • Python 踩坑记 -- 调优
  • 英特尔澄清:Core i9处理器崩溃问题根本原因仍在调查,eTVB非主因
  • python实战根据excel的文件名称这一列的内容,找到电脑D盘的下所对应的文件位置,要求用程序实现
  • LVS ipvsadm命令的使用(二)
  • Java面向对象-接口
  • 怎么不使用springboot Helper或Spring Initializr来创建spring项目
  • STM32CubeMX配置-RTC周期唤醒
  • js如何添加新元素到数组中
  • Python变量和基本数据类型
  • 嵌入式数据库_1.嵌入式数据库的定义及特点和分类
  • 新人学习笔记之(变量)
  • Windows修改CMD窗口编码为UTF-8
  • os实训课程模拟考试(1~7)