当前位置: 首页 > news >正文

[深度学习]不平衡样本的loss

不平衡样本的loss

”softmax“、”weighted softmax“、”focal“、”class-balanced“ 和 ”balanced softmax“ 都是用于多类分类任务的损失函数。它们之间的区别在于如何处理类别不均衡的问题。

Softmax 是常用的多类分类损失函数。它将输出分布转换为概率分布,其中每个类别的概率之和为 1。Softmax 在类别均衡的情况下效果很好,但在类别不均衡的情况下,它会偏向于那些更常见的类别。

Weighted softmax 是 softmax 的一种变体,它通过为每个类别分配不同的权重来解决类别不均衡问题。权重可以根据类别的数量或类别的难易程度来分配。

Focal loss 是一种更复杂的损失函数,它通过惩罚模型对容易分类的样本的预测错误来解决类别不均衡问题。Focal loss 可以显著提高模型在类别不均衡情况下的性能。

Class-balanced loss 是 focal loss 的一种变体,它通过将每个类别的权重与该类别的难易程度成反比来分配权重。Class-balanced loss 可以进一步提高模型在类别不均衡情况下的性能。

Balanced softmax 是 class-balanced loss 的一种变体,它通过将每个类别的权重与该类别的数量成反比来分配权重。Balanced softmax 可以简化 class-balanced loss 的计算。

以下是这五种激活函数的详细比较:

激活函数描述
softmax将输出转换为概率分布,其中最大概率对应于预测的类别。
weighted softmax每个类别的权重不同。可以用来处理类别不平衡的问题。
focal提高模型对少数类别的识别能力。在预测为少数类别时增加损失。
class-balanced处理类别不平衡的问题。对每个类别的损失进行加权。
balanced softmax同 class-balanced。

在实践中,通常选择 class-balanced 或 focal 来处理类别不平衡的问题。它们可以提高模型的性能,尤其是在识别少数类别时。

refenrenc

@misc{BibEntry2023Nov,
title = {{不平衡之钥: 重加权法知几何}},
journal = {知乎专栏},
year = {2023},
month = nov,
urldate = {2023-11-10},
language = {chinese},
note = {[Online; accessed 10. Nov. 2023]},
url = {https://zhuanlan.zhihu.com/p/534099210}
}

@misc{xn–vtv.xn–7yv.2023Nov,
author = {枫. 桦.},
title = {{不平衡问题: 深度神经网络训练之殇}},
journal = {微信公众平台},
year = {2023},
month = nov,
urldate = {2023-11-10},
note = {[Online; accessed 10. Nov. 2023]},
url = {https://mp.weixin.qq.com/s/KUr8yR9NQK2nqNtp7Bvlag}
}
@article{Zhang2023Apr,
author = {Zhang, Yifan and Kang, Bingyi and Hooi, Bryan and Yan, Shuicheng and Feng, Jiashi},
title = {{Deep Long-Tailed Learning: A Survey}},
journal = {IEEE Trans. Pattern Anal. Mach. Intell.},
volume = {45},
number = {9},
pages = {10795–1081610795},
year = {2023},
month = apr,
urldate = {2023-11-10},
publisher = {IEEE 出版商xn–ih7cIEEE},
language = {english},
doi = {10.1109/TPAMI.2023.3268118}
}

http://www.lryc.cn/news/224859.html

相关文章:

  • 【MySQL】表的增删改查(强化)
  • MyBatis-Plus--在xml中使用wrapper的方法
  • Oracle RAC是啥?
  • springboot中定时任务cron不生效,fixedRate指定间隔失效,只执行一次的问题
  • 苹果手机发热发烫是什么原因?看完这篇你就知道了!
  • 民安智库(第三方满意度调研公司):助力健身房提升客户满意度的秘密武器
  • 2011年09月01日 Go生态洞察:Go语言词法扫描与App Engine演示
  • pytorch搭建squeezenet网络的整套工程(升级版)
  • 222. 完全二叉树的节点个数
  • adb and 软件架构笔记
  • 算术运算符、自增自减运算符、赋值运算符、关系运算符、逻辑运算符、三元运算符
  • k8s 配置资源管理
  • expo + react native项目隐藏状态栏踩坑
  • 若依:用sqlite3随便掰饬掰饬
  • 刚安装的MySQL使用Navicat操作数据库遇到的问题
  • 物奇平台耳机宕机恢复功能实现
  • 前端学习地址_备忘录(随时更新)
  • 安卓数据恢复工具哪个强? 10 个最佳 Android 数据恢复应用程序
  • 在IDEA中配置Web开发环境
  • Cesium 相机设置
  • 【虹科干货】TWAMP:什么是双向主动测量协议?
  • bool型的盲注
  • 聊聊logback的ShutdownHook
  • 【第2章 Node.js基础】2.4 Node.js 全局对象...持续更新
  • 大数据毕业设计选题推荐-河长制大数据监测平台-Hadoop-Spark-Hive
  • Unity与java后端UDP通信
  • vue3 - swiper插件 实现PC端的 视频滑动功能(仿抖音短视频)
  • 简述SVM
  • 【DevOps】Rundeck以及Jenkins
  • 数字滤波器分析---零极点分析