当前位置: 首页 > news >正文

【机器学习笔记 Ⅱ】9 模型评估

评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法,涵盖分类、回归、聚类等任务的评估指标和技术:


一、分类模型评估

1. 基础指标

2. 高级指标
  • ROC-AUC

    • 通过绘制真正例率(TPR) vs 假正例率(FPR)曲线下面积评估模型整体性能。
    • AUC=1:完美分类;AUC=0.5:随机猜测。
    • 适用于二分类及多分类(OvR或OvO策略)。
  • 混淆矩阵

    • 可视化模型在各类别上的具体错误(如将猫误判为狗)。
    from sklearn.metrics import confusion_matrix
    cm = confusion_matrix(y_true, y_pred)
    
3. 多分类与多标签评估
  • 多分类:使用宏平均(Macro)或微平均(Micro)F1。
    from sklearn.metrics import f1_score
    f1_macro = f1_score(y_true, y_pred, average='macro')  # 各类别平等权重
    
  • 多标签
    • Hamming Loss:错误预测的标签
http://www.lryc.cn/news/581895.html

相关文章:

  • 标准128位AES/ECB/PKCS5Padding进行加解密
  • Spring Boot登录认证实现学习心得:从皮肤信息系统项目中学到的经验
  • IDEA 中使用 <jsp:useBean>动作指令时,class属性引用无效
  • 构建分布式高防架构实现业务零中断
  • 开源 C# .net mvc 开发(七)动态图片、动态表格和json数据生成
  • 银河麒麟高级服务器操作系统内核升级到最新
  • 今日行情明日机会——20250707
  • 《北京市加快推动“人工智能+医药健康“创新发展行动计划(2025-2027年)》深度解读
  • 使用CocoaPods集成第三方SDK - 从零开始完整指南
  • 算法学习笔记:9.Kruskal 算法——从原理到实战,涵盖 LeetCode 与考研 408 例题
  • docker所占硬盘内存指令
  • Unity 实现与 Ollama API 交互的实时流式响应处理
  • 图解函数调用过程(函数栈帧)
  • MongoDB与Spring Boot完整使用指南
  • windows grpcurl
  • Python脚本保护工具库之pyarmor使用详解
  • Rust 所有权系统:深入浅出指南
  • Linux运维安全新范式:基于TCPIP与SSH密钥的无密码认证实战
  • Vite 常用配置详解
  • 嵌入式数据库sqlite测试程序
  • 数据结构之树,二叉树,二叉搜索树
  • Chatbox➕知识库➕Mcp = 机器学习私人语音助手
  • C++ --- list的简单实现
  • 当“漏洞”成为双刃剑——合法披露与非法交易的生死线在哪里?
  • javaweb———html
  • 系统性红斑狼疮治疗靶点CD303
  • 1. http 有哪些版本,你是用的哪个版本,怎么查看
  • 在Ubuntu主机中修改ARM Linux开发板的根文件系统
  • RSTP 拓扑收敛机制
  • IRF堆叠技术的主要优势