当前位置：首页 > news >正文

二分类模型的性能评价指标

news 2025/7/7 20:02:51

1. 混淆矩阵 (Confusion Matrix)

	预测正类	预测负类
实际正类 (P)	True Positive (TP)	False Negative (FN)
实际负类 (N)	False Positive (FP)	True Negative (TN)

True Positive (TP): 模型正确预测为正类的样本数。
True Negative (TN): 模型正确预测为负类的样本数。
False Positive (FP): 模型错误预测为正类的负类样本数（“假阳性”）。
False Negative (FN): 模型错误预测为负类的正类样本数（“假阴性”）。

2. 常见评价指标

(1) 准确率 (Accuracy)

准确率是模型整体预测正确的比例：

$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$

适用场景: 类别平衡时适用。
局限性: 不适用于类别不平衡的问题。例如，若正类样本占比 99%，即使模型始终预测为正类，准确率也会很高，但模型实际效果差。

(2) 精确率 (Precision)

精确率衡量模型预测为正类的样本中，实际为正类的比例：

$\text{Precision} = \frac{TP}{TP + FP}$

适用场景: 注重 假阳性成本较高 的问题（如垃圾邮件分类，误报可能会打扰用户）。
局限性: 忽略了 FN 的影响，无法全面衡量模型性能。

(3) 召回率 (Recall) / 灵敏度 (Sensitivity) / 真阳性率 (True Positive Rate, TPR)

召回率衡量实际正类样本中，模型正确预测为正类的比例：

$\text{Recall} = \frac{TP}{TP + FN}$

适用场景: 注重 假阴性成本较高 的问题（如疾病诊断，漏诊可能带来严重后果）。
局限性: 忽略了 FP 的影响。

(4) 特异性 (Specificity) / 真负率 (True Negative Rate, TNR)

特异性衡量实际负类样本中，模型正确预测为负类的比例：

$\text{Specificity} = \frac{TN}{TN + FP}$

适用场景: 注重负类预测准确性的场景（如安全监控中避免误报）。

(5) F1 分数 (F1-Score)

F1 分数是精确率和召回率的调和平均值，用于平衡两者：

$\text{F1-Score} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}$

适用场景: 精确率和召回率同样重要时。
局限性: 无法区分精确率和召回率哪个更重要。

(6) 平均准确率 (Balanced Accuracy)

平衡准确率是正类和负类的平均识别率：

$\text{Balanced Accuracy} = \frac{\text{Sensitivity} + \text{Specificity}}{2}$

适用场景: 适合类别不平衡数据。

(7) ROC 曲线和 AUC 值

ROC 曲线: 以 假阳性率 (FPR) 为横轴，真阳性率 (TPR) 为纵轴绘制的曲线。
- $FPR = \frac{FP}{FP + TN}$
- $TPR = \frac{TP}{TP + FN}$
AUC (Area Under the Curve): ROC 曲线下的面积，用于衡量分类器区分正负类的能力。
- AUC 越接近 1，分类器性能越好。

(8) PR 曲线和 AUC 值

PR 曲线: 以 召回率 (Recall) 为横轴，精确率 (Precision) 为纵轴绘制的曲线。
PR-AUC: PR 曲线下的面积，适合不平衡数据集。

http://www.lryc.cn/news/505956.html

相关文章：

鸿蒙操作系统简介

单片机：实现蜂鸣器数码管的显示（附带源码）

C语言期末复习笔记（上）

HarmonyOS 实时监听与获取 Wi-Fi 信息

Unity超优质动态天气插件(含一年四季各种天气变化，可用于单机局域网VR)

1 JVM JDK JRE之间的区别以及使用字节码的好处

【网络安全】网站常见安全漏洞—服务端漏洞介绍

MAPTR：在线矢量化高精地图构建的结构化建模与学习(2208)

基于容器的云原生，让业务更自由地翱翔云端

大屏开源项目go-view二次开发2----半环形控件(C#)

web：pc端企业微信登录-vue版

OpenGL ES 01 渲染一个四边形

【ETCD】【源码阅读】深入解析 EtcdServer.applyEntries方法

概率论得学习和整理28：用EXCEL画折线图，X轴数据也被当成曲线的解决办法

tryhackme-Pre Security-Defensive Security Intro（防御安全简介）

PHP木马编写

游戏AI实现-寻路算法（Dijkstra）

Android OpenGLES2.0开发（九）：图片滤镜

SQLite Update 语句

Metaploit-永恒之蓝漏洞利用

机器学习预处理-表格数据的空值处理

数据结构_平衡二叉树

C++对象的赋值与复制复制构造函数（指针数据成员）

Coding Caprice - monotonic stack2

Spring Mvc面试题(常见)

opencv # Sobel算子、Laplacian算子、Canny边缘检测、findContours、drawContours绘制轮廓、外接矩形

Neo4j插入数据逐级提升速度4倍又4倍

C++特殊类设计（单例模式等）

J8学习打卡笔记