当前位置: 首页 > news >正文

Huber Loss(胡贝损失)详解:稳健回归的秘密武器 + Python实现

在机器学习特别是回归任务中,常用的损失函数有两类:

  • 均方误差(MSE):对离群点敏感,稳定性差;

  • 平均绝对误差(MAE):对离群点鲁棒,但梯度不连续,优化困难。

有没有一种方法可以融合两者的优点呢?答案就是——Huber Loss

📘 一、Huber Loss 是什么?

Huber Loss 是一种 鲁棒性强的回归损失函数,结合了 MSE 与 MAE 的优点:

  • 小误差区间:使用 MSE,提供平滑梯度;

  • 大误差区间:切换为 MAE,减少离群点影响。

🧮 二、Huber Loss 的数学公式(LaTeX)

设:

  • y:真实值

  • \hat{y}​:预测值

  • \delta:阈值参数(默认常设为 1)

定义如下:

\text{Huber}(y, \hat{y}) = \begin{cases} \frac{1}{2} (y - \hat{y})^2, & \text{if } |y - \hat{y}| \leq \delta \\ \delta \cdot (|y - \hat{y}| - \frac{1}{2} \delta), & \text{otherwise} \end{cases} 

✅ 如果误差较小(小于 \delta),使用平方损失;否则使用线性损失,防止离群点主导梯度。 

💡 三、Huber Loss 的 Python 实现

包含单样本与批量样本支持:

def huber_loss(y_true, y_pred, delta=1.0):"""计算单个样本的 Huber Loss参数:y_true: 实际值y_pred: 预测值delta : 平滑参数,控制 MSE 与 MAE 的切换点返回:float: 单样本的 Huber 损失"""error = y_true - y_predif abs(error) <= delta:return 0.5 * error ** 2else:return delta * (abs(error) - 0.5 * delta)def huber_loss_batch(y_true_list, y_pred_list, delta=1.0):"""批量样本 Huber Loss 平均参数:y_true_list: 实际值列表y_pred_list: 预测值列表delta      : 平滑超参数返回:float: 平均损失值"""losses = [huber_loss(yt, yp, delta) for yt, yp in zip(y_true_list, y_pred_list)]return sum(losses) / len(losses)# 示例测试
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]print("Huber Loss:", huber_loss_batch(y_true, y_pred))

📊 四、Huber Loss vs MSE vs MAE 

特性MSEMAEHuber Loss
离群点影响非常敏感鲁棒适中(可调节 delta)
导数连续性
训练稳定性容易受异常值影响收敛慢平滑,效果最佳
应用场景噪声小,数据规整噪声大或存在离群点有部分异常数据,更通用

📌 五、适用场景

Huber Loss 适合用于以下任务:

  • 房价预测、出租车费用等存在偶发异常值的回归问题;

  • 深度学习模型中要求 平滑梯度、鲁棒优化 的场景;

  • 联合训练中作为一个 辅助损失函数(Auxiliary Loss) 使用。

🧠 六、总结

  • Huber Loss 结合了 MAE 与 MSE 的优势;

  • 提供平滑梯度,收敛更稳定;

  • 可以通过调整 delta 控制敏感度;

  • 是现代回归模型中非常推荐的损失函数。

http://www.lryc.cn/news/592316.html

相关文章:

  • 【Git专栏】git如何切换到某个commit(超详细)
  • 铁路基础设施无人机巡检技术及管理平台
  • 【IOS webview】IOS13不支持svelte 样式嵌套
  • 计算机网络知名端口分配全表(0-1023)
  • 前端之CSS
  • Http请求中的特殊字符
  • 太阳辐射监测站:洞察太阳能量的科技之眼
  • RabbitMQ—TTL、死信队列、延迟队列
  • k8s:手动创建PV,解决postgis数据库本地永久存储
  • Java Set 集合详解:从基础语法到实战应用,彻底掌握去重与唯一性集合
  • 基于K8s ingress灰度发布配置
  • Docker报错:No address associated with hostname
  • 使用python读取json数据,简单的处理成元组数组
  • 内网部署yum源
  • 美团闪购最新版 mtgsig1.2
  • 从服务实例的元数据中获取配置值 vs 从本地配置文件中获取配置值
  • 4G模块 A7680发送中文短信到手机
  • IT66122替代IT66121-富利威
  • 「源力觉醒 创作者计划」_巅峰对话:文心 4.5 vs. DeepSeek / Qwen 3.0 深度解析(实战优化版)
  • 文件管理-文件控制块和索引节点
  • Java 抽象类与接口深度解析
  • 进阶数据结构:红黑树
  • 可靠消息最终一致性分布式事务解决方案
  • Web3加密货币交易:您需要知道的所有信息
  • MySql:索引,结构
  • 服务器mysql数据的简单备份脚本
  • Ansible + Shell 服务器巡检脚本
  • C#`Array`进阶
  • ChatGPT Agent技术架构探析
  • 力扣面试150(33/150)