当前位置: 首页 > news >正文

大语言模型涉及的一些概念(持续更新)

1、entropy

在自然语言处理(NLP)和机器学习中,entropy(熵)是一个非常重要的概念,来自信息论(Information Theory),本质上是用来衡量“不确定性”或“信息量”的。

通俗理解 Entropy(熵)

熵 = 不确定性 = 随机程度

举例:

  • 如果一个模型输出的概率分布是:
    {"猫": 0.33, "狗": 0.33, "鸟": 0.34}
    → 表示模型非常不确定 → 熵高

  • 如果输出是:
    {"猫": 0.98, "狗": 0.01, "鸟": 0.01}
    → 模型很有把握 → 熵低

2、token

什么是 Token?

Token(标记) 是把文本分割成模型可理解的“最小单位”,可以是:

类型示例描述
单词级 token["I", "am", "happy"]一个词就是一个 token(粗粒度)
子词级 token["un", "happi", "ness"]把词拆成词根+后缀(BPE等方法)
字符级 token["h", "e", "l", "l", "o"]每个字符一个 token(细粒度)

不同模型和 tokenizer 使用不同的分词策略。

 

http://www.lryc.cn/news/608668.html

相关文章:

  • 安卓加固脱壳
  • 1.8 axios详解
  • Axios介绍
  • 超声波泄露传感器
  • SpringBoot3.x入门到精通系列:2.6 整合 Redis 详解
  • Python 基础语法(一):从常量到运算符
  • jvm之jconsole的使用
  • MySQL连接算法和小表驱动大表的原理
  • 初识prometheus
  • Selenium Web 自动化
  • 【软考中级网络工程师】知识点之 RIP 协议
  • 华为智能家居与Spring人工智能
  • 决策树学习全解析:从理论到实战
  • C++手撕基于ID3算法的决策树
  • 著作权登记遇难题:创作者如何突破确权困境?
  • 自动驾驶中的传感器技术19——Camera(10)
  • ELECTRICAL靶场
  • ClickHouse Windows迁移方案与测试
  • 【动态规划算法】路径问题
  • WebRTC前处理模块技术详解:音频3A处理与视频优化实践
  • Node.js (Express) + MySQL + Redis构建项目流程
  • 决策树的实际案例
  • sqli-labs:Less-25关卡详细解析
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | TodoList(代办事项组件)
  • 子区间问题
  • 主机序列号的修改方法与原理
  • Azure DevOps 中的代理
  • 渗透作业4
  • LeetCode - 合并两个有序链表 / 删除链表的倒数第 N 个结点
  • webrtc弱网-QualityScaler 源码分析与算法原理