当前位置：首页 > news >正文

语义熵怎么增强LLM自信心的

news 2025/7/20 19:34:15

语义熵怎么增强LLM自信心的

在这里插入图片描述

一、传统Token熵的问题（先理解“痛点”）

比如模型回答“阿司匹林是否治疗头痛？”→ 输出“是”

传统Token熵：只看“词的概率”，比如“是”这个词的概率特别高（Token熵0.2，数值低说明确定性强）。
但实际风险：医学场景里，“是”的字面肯定，不代表语义上绝对正确（比如阿司匹林能缓解头痛，但有禁忌症、不能随便用）。传统Token熵没考虑语义层面的“模糊性、风险”，可能输出看着确定，实际语义上漏洞大。

二、语义熵的核心逻辑（解决什么问题？）

语义熵想干的事：不只看“选了哪个词”，更看“语义是否严谨、有没有隐藏风险”。

怎么做？→ 用“核函数”算词之间的语义相似性（比如“缓解”“治疗”“止痛”在语义上是相关的），再构建一个“语义密度”的概率分布（类似：哪些语义是模型实际想表达的？有多集中？）。
公式简化理解：

http://www.lryc.cn/news/593779.html

相关文章：

MyBatis动态SQL全解析：五大核心标签实战指南

IIS部署 .net项目

新华三ACG身份验证实验

Linux操作系统之线程（三）

JavaScript基础语法和简单数据结构

响应式单位rpx及搭配使用UI产品工具

Java-Lambda表达式

Ceph存储阈值调整：优化nearfull_ratio参数

Vue组件化开发小案例

lvs 集群技术

LVS技术知识详解（知识点+相关实验部署）

Linux内核设计与实现 - 第6章内核数据结构

[AI风堇]基于ChatGPT3.5+科大讯飞录音转文字API+GPT-SOVITS的模拟情感实时语音对话项目

一动一静皆消耗——IC设计之低功耗技术(Low Power Design)

Linux C 信号操作

单稳态触发器Multisim电路仿真——硬件工程师笔记

CS231n-2017 Lecture3线性分类器、最优化笔记

深度解析 rag-vector-agent-semantic-kernel：基于 Semantic Kernel 的 Agentic RAG 实践

web.m3u8流媒体视频处理

巧用Callbre RVE生成DRC HTML report及CTO的使用方法

Js中var VS let VS const

关于饥饿加载（Eager Loading）

解锁C++性能密码：TCMalloc深度剖析

4 ASPICE的支持过程

Spring AI硬核攻略：235个模块解析 + 6大场景实战

opencv圖片標注

Redisson RLocalCachedMap 核心参数详解