当前位置: 首页 > news >正文

Focal Loss介绍

目录

  • 前言
  • 一. Focal Loss
  • 二. 总结

前言

  在目标检测算法中,我们会经常遇到Focal Loss这个东西,今天我们就来简单的分下下这个损失。

一. Focal Loss

  在深度学习训练的时候,在遇到目标类别不平衡时,如果直接计算损失函数,那么最终计算的结果可能会偏向于常见类别,低召回率,模型过拟合等问题。为了应对这个问题,于是引出了Focal Loss。具体来说,Focal Loss引入了一个可调参数 γ \gamma γ,用于调整易分类样本和困难样本之间的权重关系。当 γ \gamma γ的值较低时,模型更加关注易分类样本,而当 γ \gamma γ的值较高时,模型更加关注困难样本。Focal Loss的定义如下:
F L ( p t ) = − α ( 1 − p t ) γ log ⁡ ( p t ) FL(p_t) = -\alpha(1 - p_t)^\gamma \log(p_t) FL(pt)=α(1pt)γlog(pt)

  在目标检测中,Focal Loss通常用于one-stage的算法中,因为two-stage的算法第一阶段已经筛选过一次了,第二阶段候选框不会造成正负样本的严重失衡。举个例子,在一张图片中,目标通常是比较少的,通常最对也就几十个,但是在使用候选框选取的时候,我们设置的候选框的数量时比较多的,通常都是几万个,如果我们给每个目标贡献的损失设置为10,目标的损失也不过几百,剩下候选框设置贡献的损失为0.1,背景的损失也将达到几千,那么就会导致网络非常关注非目标,也就是背景,从而导致检测效果非常差。
  简答总结一句话Focal Loss的作用,其实就是给网络设置个超参数,让网络自己学习正负样本的权重系数,使得网络能够平衡的关注目标和背景,从而不偏袒一方。
看个例子:其中p表示预测概率,y表示真实标签,CE 表示普通的交叉熵损失,FL表示Focal Loss,计算是以 γ = 2 , α = 0.5 \gamma=2, \alpha=0.5 γ=2,α=0.5计算的。

pyCEFLCE/FL
0.910.1050.00026400
0.96810.0330.0000083906
0.100.1050.00079133
0.03200.0330.0000251302
0.112.30.4664.9
0.902.31.41.6

  通过上面的例子可以看出,对于易分样本,Focal Loss能够显著降低他的权重比例,对于难分样本会有稍微降低。在使用的时候Focal Loss易受噪音的干扰。
这里提个问题:Focal LossOHEM(采样正负样本)的区别?

二. 总结

定义:

  • Focal Loss的关键思想是引入一个可调参数,它用于减小易分类样本的权重,并使模型更加关注困难样本。
  • OHEM(Online Hard Example Mining)是一种用于解决类别不平衡问题的训练策略。OHEM通过在每个训练迭代中选择一小部分难例样本,将它们添加到训练集中,从而提高模型对困难样本的学习能力。

区别:

  • Focal Loss是一种损失函数,而OHEM是一种训练策略。
  • Focal Loss主要用于减轻简单样本对训练的影响,提高模型对困难样本的学习能力。而OHEM主要通过挖掘难例样本来增强模型的学习能力。

以上就是关于Focal Loss的介绍,如有错误,敬请指正!

http://www.lryc.cn/news/93016.html

相关文章:

  • 【数据结构与算法】04 哈希表 / 散列表 (哈希函数、哈希冲突、链地址法、开放地址法、SHA256)
  • 每日一道面试题之介绍一下Java的序列化和反序列化!
  • Netty实战(十一)
  • Qos服务质量、心跳机制、保留消息,遗嘱信息,用户密码认证
  • MATLAB 之 线性方程组求解
  • 华为OD机试真题 Java 实现【字符串序列判定】【2022Q4 100分】,附详细解题思路
  • taro使用小记 —— 持续更新
  • 【LeetCode】110. 平衡二叉树
  • SQL视图、存储过程、触发器
  • DNS隧道穿透
  • 1.2 Scala变量与数据类型
  • 深入探讨软件测试的质量度量指标
  • 6.12作业
  • RabbitMQ集群部署之镜像模式
  • 【算法】Remove Zero Sum Consecutive Nodes from Linked List 从链表中删去总和值为零的连续节点
  • 音悦台项目测试报告
  • 数据库存储过程和函数
  • Spring依赖注入有哪些?各有什么优缺点?
  • java八股文-并发篇
  • Elasticsearch8.6.0安装
  • Vue - 第五天 动态组件 插槽 自定义指令
  • 如何开展web自动化测试
  • 【博学谷学习记录】超强总结,用心分享 | 架构师 Maven学习总结
  • PPT里文字太多如何排版-一口气教你7种布局瞬间让PPT高大上起来
  • Whistle(基于 Node 实现的跨平台抓包调试工具)的使用
  • 数学模型:Python实现非线性规划
  • Docker网路模型(四)使用 bridge 网络
  • 数据结构与算法之美 | 排序(2)
  • 【外企面试系列】必备口语短语与例句 - A系列
  • Java使用Opencv进行大图找小图并使用其找图功能进行bilibili视频下载案例