当前位置：首页 > news >正文

【机器学习】机器学习的基本分类-监督学习-逻辑回归-对数似然损失函数（Log-Likelihood Loss Function）

news 2025/7/20 17:09:58

对数似然损失函数（Log-Likelihood Loss Function）

对数似然损失函数是机器学习和统计学中广泛使用的一种损失函数，特别是在分类问题（例如逻辑回归、神经网络）中应用最为广泛。它基于最大似然估计原理，通过最小化负对数似然（negative log-likelihood, NLL）来优化模型参数。

1. 对数似然损失的定义

对于一个分类问题，我们的目标是预测输入 x 属于类别 y∈{0,1} 的概率。假设模型输出的概率为 $P(y=1|x) = \hat{y}$ ，则：

对数似然函数

似然函数衡量模型参数在观察到数据下的概率。假设数据集为 $\{(x_i, y_i)\}_{i=1}^N$ ，样本 i 的预测概率为 $\hat{y}_i$ ，其似然函数为：

$L(\theta) = \prod_{i=1}^N P(y_i | x_i; \theta)$

对数似然函数

对数化简乘积：

$\ell(\theta) = \log L(\theta) = \sum_{i=1}^N \log P(y_i | x_i; \theta)$

2. 损失函数形式

为了简化计算，优化通常使用负对数似然损失函数（即最大化对数似然的对立面）：

$\mathcal{L}(\theta) = -\ell(\theta) = -\sum_{i=1}^N \log P(y_i | x_i; \theta)$

二分类问题

对二分类问题，假设 $P(y=1|x) = \hat{y}$ ， $P(y=0|x) = 1 - \hat{y}$ ，则：

$P(y|x) = \hat{y}^y (1 - \hat{y})^{1-y}$

对数化并取负得到：

$\mathcal{L}(\theta) = -\sum_{i=1}^N \left[ y_i \log \hat{y}_i + (1 - y_i) \log (1 - \hat{y}_i) \right]$

这就是交叉熵损失函数的形式，广泛用于二分类问题。

3. 推导直观理解

1. 对数似然的意义

对数似然量化了模型预测的质量：

$y_i = 1$ ：我们希望预测概率 $\hat{y}_i$ 越大越好。
$y_i = 0$ ：我们希望预测概率 $1 - \hat{y}_i$ 越大越好。

通过最大化对数似然（或最小化负对数似然），模型会调整参数使其预测概率最接近真实概率。

2. 为什么对数？

简化计算：对数化后，将乘积变为求和，优化更加高效。
凸性：对数函数的特性使得损失函数在很多情况下是凸的，便于求解全局最优解。

4. 多分类问题

对于多分类问题（如 softmax 分类器），假设类别标签为 y∈{1,2,…,K}y，模型预测类别 j 的概率为 $\hat{y}_j = P(y=j|x)$ 。

似然函数

$P(y|x) = \prod_{j=1}^K \hat{y}_j^{\mathbb{1}(y=j)}$

其中 ${1}(y=j)$ 是指示函数，表示样本 y 是否属于类别 j。

对数化

$\ell(\theta) = \log P(y|x) = \sum_{j=1}^K \mathbb{1}(y=j) \log \hat{y}_j$

负对数似然损失

对于整个数据集：

$\mathcal{L}(\theta) = -\frac{1}{N} \sum_{i=1}^N \log \hat{y}_{i,y_i}$

其中， $\hat{y}_{i,y_i}$ 是样本 i 对真实类别 $y_i$ 的预测概率。

5. 代码实现

以下是二分类和多分类对数似然损失的 Python 实现：

1. 二分类损失

import numpy as npdef binary_log_likelihood_loss(y_true, y_pred):"""计算二元对数似然损失函数。参数:y_true: 真实标签数组，包含0和1，表示负类和正类。y_pred: 预测标签数组，包含0到1之间的浮点数，表示属于正类的概率。返回:返回二元对数似然损失函数的负均值。"""# 避免数值问题y_pred = np.clip(y_pred, 1e-10, 1 - 1e-10)# 计算并返回二元对数似然损失return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))# 示例
y_true = np.array([1, 0, 1, 1, 0])
y_pred = np.array([0.9, 0.1, 0.8, 0.7, 0.3])
# 计算损失并输出
loss = binary_log_likelihood_loss(y_true, y_pred)
print("Binary Log-Likelihood Loss:", loss)

输出结果

Binary Log-Likelihood Loss: 0.22944289410146546

2. 多分类损失

from sklearn.metrics import log_loss# 示例数据
# 实际的类别标签
y_true = [0, 2, 1, 2]
# 预测的类别概率，每个子列表代表一个样本预测为各个类别的概率
y_pred = [[0.9, 0.05, 0.05],[0.1, 0.1, 0.8],[0.2, 0.7, 0.1],[0.05, 0.1, 0.85]
]# 使用 sklearn 计算对数似然损失
# 该函数计算的是模型预测的类别概率与实际类别标签之间的对数似然损失
# 对于多分类问题，该损失函数可以衡量模型预测概率与真实标签之间的差异程度
loss = log_loss(y_true, y_pred)
print("Multi-class Log-Likelihood Loss:", loss)

输出结果

Multi-class Log-Likelihood Loss: 0.2119244851021358

6. 对数似然损失的应用

逻辑回归：
- 二分类逻辑回归中，使用对数似然损失来拟合模型参数。
神经网络：
- 输出层通常采用 softmax 函数并结合对数似然损失，用于多分类任务。
最大熵模型：
- 最大化熵等价于最小化负对数似然。

7. 优点与缺点

优点

对概率建模有理论支撑，直观解释预测置信度。
能有效捕捉预测概率的质量。

缺点

对异常值敏感：错误分类的高置信预测会导致损失剧增。
数值问题：log⁡(0) 会引发计算错误，需引入数值稳定策略。

对数似然损失函数连接了统计学中的最大似然估计与机器学习中的损失优化，是现代监督学习模型的理论基石之一！

查看全文

http://www.lryc.cn/news/494261.html

51c自动驾驶~合集35

网络安全体系与网络安全模型

antd table 自定义表头过滤表格内容

Elasticsearch实战：从搜索到数据分析的全面应用指南

BEPUphysicsint定点数3D物理引擎介绍

宠物领养平台构建：SpringBoot技术路线图

解决Flink读取kafka主题数据无报错无数据打印的重大发现（问题已解决）

python自动化测开面试题汇总(持续更新)

1-1 Gerrit实用指南

docker如何安装redis

省级新质生产力数据（蔡湘杰版本）2012-2022年

【游资悟道】-作手新一悟道心法

Diffusion中的Unet （DIMP）

编译以前项目更改在x64下面时报错:函数“PVOID GetCurrentFiber(void)”已有主体

【AIGC】大模型面试高频考点-数据清洗篇

当测试时间与测试资源有限时，你会如何优化测试策略？

基于R语言森林生态系统结构、功能与稳定性分析与可视化

如何使用 Python 实现插件式架构

【北京迅为】iTOP-4412全能版使用手册-第二十章搭建和测试NFS服务器

【纯原生js】原生实现h5落地页面中的单选组件按钮及功能

深入浅出：开发者如何快速上手Web3生态系统

通过深度点图表示的隐式场实现肺树结构的高效解剖标注文献速递-生成式模型与transformer在医学影像中的应用

数据结构（17）广义表

论文笔记 SliceGPT: Compress Large Language Models By Deleting Rows And Columns

前端工具的选择和安装

Fantasy中定时器得驱动原理

【反转链表】力扣 445. 两数相加 II

SpringBoot 项目中使用 spring-boot-starter-amqp 依赖实现 RabbitMQ

Uniapp 安装安卓、IOS模拟器并调试

JavaScript 中的原型和原型链

1. 对数似然损失的定义

对数似然函数

对数似然函数

2. 损失函数形式

二分类问题

3. 推导直观理解

1. 对数似然的意义

2. 为什么对数？

4. 多分类问题

似然函数

对数化

负对数似然损失

5. 代码实现

1. 二分类损失

2. 多分类损失

6. 对数似然损失的应用

7. 优点与缺点

优点

缺点

相关文章：