当前位置: 首页 > news >正文

Logistic Loss Function|逻辑回归代价函数

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、逻辑回归代价函数的定义

逻辑回归的代价函数(又称交叉熵损失)用于评估模型预测结果与真实标签之间的差异。不同于线性回归的均方误差,它专门针对分类问题设计,能够有效惩罚“高置信度的错误预测”,同时鼓励模型输出更接近真实标签的概率值。

通俗理解

想象老师在批改判断题:

  • 如果学生非常自信地答错(比如写“绝对选A”,但正确答案是B),老师会狠狠扣分。

  • 如果学生答对但不太确定(比如写“可能是A”),老师会适当给分。

  • 如果学生答对且很确定(比如写“肯定选A”),老师会给满分。
    代价函数的作用类似——让模型为自己的“盲目自信”付出代价,同时奖励正确且确定的预测


二、平方误差 vs 逻辑回归:代价函数的设计差异与凸性对比

D9B60E6B-55D5-4B89-9F81-494CE6188D22.png

这张图片展示了平方误差代价函数(Squared error cost)及其相关概念,主要分为以下几个部分:

  1. 平方误差代价函数公式

    4A1A1FAD-3159-48F4-BC9F-8AAC89BCD657.png

    用于衡量线性回归模型的预测值与真实值之间的误差。

  2. 损失函数(loss)

    21573285-44D4-48BC-BABF-EE48D78BC093.png

    表示单个样本的误差。

  3. 线性回归模型

    C8C4B714-C5DC-44D2-802F-9FCBE07ACEF5.png

    这是一个线性预测函数。

  4. 凸性与非凸性

    • 线性回归的代价函数 f(w,b) 是凸函数(convex),保证梯度下降能找到全局最优解。

    • 如果直接对逻辑回归使用平方误差,代价函数可能非凸(non-convex),导致优化困难。

  5. 逻辑回归的预测函数

    612B2053-923B-4A8C-A7F7-352D6A203753.png

    这是一个Sigmoid函数,将线性输出映射到概率(0, 1)。

图片的核心对比了线性回归(平方误差)逻辑回归(需用交叉熵损失)在代价函数设计上的差异。


三、逻辑回归代价函数公式

49D8EDA0-2B7C-43FC-B934-19D23F566A76.png

E0826B26-E1B3-4B88-A544-744548A1C88D.png

CF3FC85B-876D-4ED3-92DF-72D712EF171D.png

  1. 分段定义
    损失函数 L 根据真实标签 y(i) 的取值(0 或 1)分段计算:

    • 若 y(i)=1,损失为 −log⁡(fW,b(x⃗(i)))。

    • 若 y(i)=0,损失为 −log⁡(1−fW,b(x⃗(i)))。

  2. 损失变化趋势

    • 当预测值 fW,b(x⃗(i)) 接近真实标签时(如 y(i)=1 且 f→1),损失趋近于 0。

    • 当预测值与真实标签相反时(如 y(i)=1 但 f→0),损失趋近于无穷大。

  3. 核心作用
    损失函数通过对数惩罚机制,迫使模型对错误预测(尤其是高置信度错误)付出更高代价,从而推动参数优化。

  4. 优化目标
    通过调整参数 w⃗,b 最小化代价函数 J,使模型预测 fw⃗,b(x⃗) 尽可能接近真实标签 y。


四、逻辑回归损失函数的两种表达形式及其统一化

9E1D859F-394E-41A4-BAF2-44EB4705F760.png

629884A2-BA9C-4BA9-8600-01719C3D3537.png

  1. 第一幅图

    • 展示了逻辑回归损失函数从分段形式统一形式的简化过程。

    • 分段形式(直观但冗长):

      • 当 y=1,损失为 −log⁡(f(x))

      • 当 y=0,损失为 −log⁡(1−f(x))

    • 统一形式(紧凑且通用):

      CA82C261-E6ED-46DC-A3C1-46C9DB343766.png

    • 通过数学技巧将两种情况合并为一个公式,便于计算和优化。

  2. 第二幅图

    • 将单样本的损失函数推广到整体代价函数(所有样本的平均损失)。

    • 公式:

      C790BD27-85EC-4B46-9E62-706B4E09F154.png

    • 强调该函数是凸函数(convex),保证梯度下降能找到全局最优解。

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

http://www.lryc.cn/news/617821.html

相关文章:

  • 人工智能-python-机器学习-逻辑回归与K-Means算法:理论与应用
  • 【电机控制】FOC单电阻电流采样配置
  • DHCP 服务详解与部署
  • React 19 通用 ECharts 组件
  • Redis应⽤-缓存与分布式锁
  • Linux驱动学习day27天(USB驱动理论部分)
  • 修改学生信息管理系统以及查询
  • Ansys Mechanical中的声学分析
  • Nestjs框架: RBAC基于角色的权限控制模型初探
  • java内部类-匿名内部类
  • 适用于高质量核磁共振(NMR)的溶剂推荐
  • Apache ECharts 6 核心技术解密 – Vue3企业级可视化实战指南
  • 每日五个pyecharts可视化图表-line:从入门到精通 (3)
  • 编程技术杂谈4.0
  • SQL复杂查询
  • 论文学习22:UNETR: Transformers for 3D Medical Image Segmentation
  • TCGA数据集下载工具gdc-client下载慢解决方案
  • 掘金数据富矿,永洪科技为山东黄金定制“数智掘金”实战营
  • JavaScript let的使用
  • macos彻底删除vscode
  • 2025年农业工程与环境预防国际会议(ICAEEP 2025)
  • k8s 部署mysql主从集群
  • 用AListLite让安卓手机成为NAS实现文件共享
  • 基于开源模型构建医疗疾病大模型:从理论到实践
  • 2025牛客多校第八场 根号-2进制 个人题解
  • USB 基本描述符
  • TRL - Transformer Reinforcement Learning SFTTrainer 和 SFTConfig
  • AI(2)-神经网络(激活函数)
  • 当生产环境卡成 PPT:Spring Boot 线程 Dump 捉妖指南 - 第544篇
  • 【09-神经网络介绍2】