当前位置: 首页 > news >正文

二分类评价指标AUROC和AUPR

文章目录

  • 一、AUROC(Area Under the Receiver Operating Characteristic Curve)
  • 二、AUPR(Area Under the Precision-Recall Curve)
  • 三、区别
    • 3.1 案例
    • 3.2 如何选择?

在分类任务中, AUROC(受试者工作特征曲线下面积)和 AUPR(精确率-召回率曲线下面积)是两种常用的性能评估指标,尤其适用于不平衡数据集的情况。下面是这两者的定义和解释:

一、AUROC(Area Under the Receiver Operating Characteristic Curve)

  • 定义:AUROC表示ROC曲线下面积。ROC曲线展示的是模型在不同阈值下的**真正例率(True Positive Rate, TPR)假正例率(False Positive Rate, FPR)**之间的关系。其目的是衡量模型区分正负样本的能力。

  • 真正例率(TPR):也称为召回率(Recall),表示被正确识别的正样本占所有真实正样本的比例:
    T P R = 真正例 真正例 + 假反例 TPR = \frac{\text{真正例}}{\text{真正例} + \text{假反例}} TPR=真正例+假反例真正例

  • 假正例率(FPR):表示被错误识别为正样本的负样本占所有真实负样本的比例:
    F P R = 假正例 假正例 + 真反例 FPR = \frac{\text{假正例}}{\text{假正例} + \text{真反例}} FPR=假正例+真反例假正例

  • 解读

    • AUROC 值范围在0到1之间,1表示完美分类,0.5表示随机猜测,低于0.5则表示模型表现不佳。

二、AUPR(Area Under the Precision-Recall Curve)

  • 定义:AUPR表示精确率-召回率曲线下面积。PR曲线展示的是不同阈值下的**精确率(Precision)召回率(Recall)**的关系。AUPR在处理正负样本数量严重不平衡时更有用。

  • 精确率(Precision):表示被正确识别为正样本的实例占所有被预测为正样本实例的比例:
    [
    \text{精确率} = \frac{\text{真正例}}{\text{真正例} + \text{假正例}}
    ]

  • 召回率(Recall):与AUROC中的TPR相同,表示被正确识别为正样本的比例。

  • 解读

    • AUPR值越高,表示模型在正样本上的检测性能越好,尤其是对于不平衡数据,AUPR比AUROC更能反映正样本的识别能力。

三、区别

3.1 案例

请添加图片描述

上图展示了ROC曲线PR曲线,并分别计算了它们的AUROCAUPR值。

  • 左图:ROC曲线展示了不同阈值下真正例率(TPR)与假正例率(FPR)的关系,曲线下面积(AUROC)为衡量模型整体区分正负样本的能力。

    • 曲线下的面积越大(接近1),模型的性能越好。
    • 随机猜测的曲线是一条45度的对角线,AUROC为0.5。
  • 右图:PR曲线展示了不同阈值下精确率(Precision)与召回率(Recall)的关系,曲线下面积(AUPR)衡量模型在正类样本上的表现,特别适用于正负样本不平衡的数据。

    • 曲线下的面积越大(接近1),表示模型对正样本的检测能力越强。

3.2 如何选择?

  • 何时使用 AUROC

    • 当你的数据集是 平衡的,并且正负类别同样重要时。
    • 当你希望评估模型在 所有阈值下的整体表现
    • 当你想了解模型 区分正负类样本的能力,而不太在意假正例的影响时。
  • 何时使用 AUPR

    • 当你的数据集是 不平衡的,正类很少但却非常关键时。
    • 当你更关注模型的 精确率 和如何 正确识别正类样本 而不是生成过多假正例时。
    • 当你在处理如疾病检测、欺诈检测或异常检测等对正类检测要求更高的任务时。
  • 总结

    • AUROC 适用于平衡数据集,提供了分类器整体区分正负类的能力。
    • AUPR 更适用于不平衡数据集,特别关注正类的检测能力和减少假正例的能力。
http://www.lryc.cn/news/465969.html

相关文章:

  • 雅迪控股营收、净利润和毛利下滑:销量大幅减少,屡屡抽查不合格
  • 【网络安全】记一次漏洞挖掘
  • Redis遇到Hash冲突怎么办?
  • React综合指南(四)
  • Spring集成Redisson及存取几种基本类型数据
  • Maplibre-gl\Mapbox-gl改造支持对矢量瓦片加密
  • 【功能安全】技术安全概念TSC
  • Spark数据源的读取与写入、自定义函数
  • LeetCode 每日一题 2024/10/14-2024/10/20
  • 接口测试(六)jmeter——参数化(配置元件 --> 用户定义的变量)
  • 【学习笔记】网络流
  • 【鸡翅Club】项目启动
  • python+大数据+基于热门视频的数据分析研究【内含源码+文档+部署教程】
  • 【电子电力】基于PMU相量测量单元的电力系统状态评估
  • ubuntu修改默认开机模式(图形/终端)
  • LaMI-DETR:基于GPT丰富优化的开放词汇目标检测 | ECCV‘24
  • AI大模型是否有助于攻克重大疾病?
  • 【渗透测试】-红日靶场-获取web服务器权限
  • python 深度学习 项目调试 图像分割 segment-anything
  • 【GO实战课】第六讲:电子商务网站(6):支付和订单处理
  • 专题十三_记忆化搜索_算法专题详细总结
  • 已发布金融国家标准目录(截止2024年3月)
  • 【论文#快速算法】Fast Intermode Decision in H.264/AVC Video Coding
  • Git核心概念图例与最常用内容操作(reset、diff、restore、stash、reflog、cherry-pick)
  • 【人工智能在医疗企业个人中的应用】
  • IPv4头部和IPv6头部
  • 从零开始手把手带你训练LLM保姆级教程,草履虫都能学会!零基础看完这篇就足够了~
  • strcat函数追加字符串
  • 每月洞察:App Store 和 Google Play 的主要更新
  • 【python openai function2json小工具】