当前位置: 首页 > article >正文

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

机器学习第十八讲:混淆矩阵 → 诊断模型在医疗检查中的误诊情况

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


混淆矩阵是模型诊断的体检报告,能清晰展示分类模型的各种"误诊"类型[^8-1]。通过医疗检查案例详细说明:

一、核心概念(类似疫情筛查报告)

假设医院用AI模型检测1000份血样,实际有50人感染病毒:

实际阳性
实际阴性
实际阳性
实际阴性
预测阳性
真阳性TP
假阳性FP
预测阴性
假阴性FN
真阴性TN

示例数据
| | 实际感染 | 实际健康 |
|----------------|---------|---------|
| 预测感染 | TP=45 | FP=10 |
| 预测健康 | FN=5 | TN=940 | [2][4]

二、关键指标解读(医生最关注的4个数据)

  1. 假阳性(误诊):健康人被误判为感染者 → 造成过度治疗 [参考材料1]
  2. 假阴性(漏诊):感染者被误判为健康 → 导致疫情扩散 [参考材料6]
  3. 精确率 = TP/(TP+FP) = 45/55 ≈ 81.8% → 预测感染者的可信度 [参考材料2]
  4. 召回率 = TP/(TP+FN) = 45/50 = 90% → 真实感染者的检出率 [参考材料6]
模型捕捉到
模型漏掉
被误判
正确排除
总样本1000
实际感染50
实际健康950
TP=45
FN=5
FP=10
TN=940

三、医疗场景应用(新冠肺炎检测案例)

案例背景:CT影像AI诊断系统 [参考材料4]

  • 数据集:500张肺部CT(300新冠阳性,200阴性)
  • 模型预测结果:
    # 混淆矩阵数值
    [[275,  25],  # 真阳性275 | 假阳性25[ 15, 185]]  # 假阴性15 | 真阴性185
    

问题诊断

  1. 假阳性问题:25例健康人需复检 → 增加医疗资源消耗
  2. 假阴性危机:15例漏诊患者成为传染源 → 需提升模型灵敏度[^6]
  3. 平衡建议:调整阈值使FN<5,即使FP増至40 [参考材料6]

类比说明:就像机场安检,过分严格(低FP)会延误旅客,过于宽松(低FN)会放过危险品,需权衡两者[^8-1]

四、可视化呈现(热力图诊断)

原始预测
标准化评估
颜色映射
异常值定位

实操步骤

  1. 用seaborn绘制热力矩阵 [参考材料3]
    sns.heatmap([[275,25],[15,185]], annot=True, cmap="Blues") 
    
  2. 深色块表示问题区域:
    • 左下角(15):急需减少的漏诊病例
    • 右上角(25):可容忍的误诊误差[^4]

优化效果
调参后矩阵变为:

[[285, 35],[ 3, 177]]
  • 漏诊从15→3人,误诊从25→35人 → 更适合疫情管控 [参考材料6]

目录:总目录
上篇文章:机器学习第十七讲:PCA → 把100维数据压缩成3D视图仍保持主要特征
下篇文章:机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平


[^8-1]《零基础学机器学习》第八章第一/二节评估指标
[2][3][4][6]参见医疗检测案例实践(《零基础学机器学习》心脏病预测章节)

http://www.lryc.cn/news/2383619.html

相关文章:

  • Proxmox 主机与虚拟机全部断网问题排查与解决记录
  • 力扣560.和为K的子数组
  • MySQL——4、表的约束
  • 新浪、京东golang一面整理
  • Kotlin 协程 (二)
  • [250516] OpenAI 升级 ChatGPT:GPT-4.1 及 Mini 版上线!
  • 【完整版】基于laravel开发的开源交易所源码|BTC交易所/ETH交易所/交易所/交易平台/撮合交易引擎
  • Android Framework学习七:Handler、Looper、Message
  • MyBatis:简化数据库操作的持久层框架
  • 【001】RenPy打包安卓apk 流程源码级别分析
  • 物理信息神经网络(PINNs)在悬臂梁分析中的应用研究
  • 论文浅尝 | HOLMES:面向大语言模型多跳问答的超关系知识图谱方法(ACL2024)
  • npm、pnpm、yarn 各自优劣深度剖析
  • jenkins使用Send build artifacts over SSH发布jar包目录配置
  • uni-app小程序登录后…
  • 【深度学习基础】从感知机到多层神经网络:模型原理、结构与计算过程全解析
  • 【Leetcode】取余/2的幂次方
  • 解决Power BI Desktop导入Excel数据第一行不是列标题问题
  • springboot3.x只需两步快速整合nacos作配置中心
  • python如何遍历postgresql所有的用户表
  • c/c++的opencv高斯模糊
  • <uniapp><vuex><状态管理>在uniapp中,如何使用vuex实现数据共享与传递?
  • Java Stream流:高效数据处理的现代解决方案
  • 数据湖和数据仓库的区别
  • 【论文阅读 | AAAI 2025 | FD2-Net:用于红外 - 可见光目标检测的频率驱动特征分解网络】
  • 前端取经路——量子UI:响应式交互新范式
  • 计算机视觉与深度学习 | matlab实现EMD-VMD-LSTM时间序列预测(完整源码和数据)
  • 济南国网数字化培训班学习笔记-第三组-1-电力通信传输网认知
  • OAT 初始化时出错?问题可能出在 PAM 配置上|OceanBase 故障排查实践
  • 1-机器学习的基本概念