当前位置: 首页 > news >正文

8.18 机器学习-决策树(1)

决策树

1. 树模型本质

       分类/回归:数据从根节点→叶子节点逐步决策,最终落在叶子节点。

2. 树的组成

      根节点:第一个分裂的选择点。

      非叶子节点:中间判断条件的过程。

      叶子节点:最终决策的结果。

3. 训练 vs 测试

    训练阶段:用训练集选择特征、切分节点。

    测试阶段:按已建好的树路径直接进行预测。

4. 特征选择标准

     熵:衡量数据不确定性(熵越低→数据不确定性越小)。

     信息增益:特征分裂后熵的不确定减少的程度(增益越大→特征越优)。

5. 构造实例(以“14天打球”为例)

    步骤:

  1.   计算原始熵(9打球/5不打球 → 熵=0.940)。

  2.   计算各特征(如Outlook)的条件熵和信息增益。

  3.   选增益最大的特征作为根节点,递归生成子树。

课堂练习:通过数据集构造决策树

1、总熵

E(D)=−k∑​plog2​(p​)

(属于鱼类=是):2个(1、2)

(属于鱼类=否):3个(3、4、5)

熵≈0.971

2、信息增益

:3(1、2、3)

熵:−(32​log2​32​+31​log2​31​)≈0.918

:2(4、5)

熵:0

信息增益=0.420

http://www.lryc.cn/news/624383.html

相关文章:

  • goland怎么取消自动删除未使用的包
  • SWMM排水管网水力、水质建模及在海绵与水环境中的应用技术-模拟降雨和污染物质经过地面、排水管网、蓄水和处理
  • 【前端面试题】JavaScript 核心知识点解析(第一题到第三十题)
  • 2025 世界机器人大会启示录:机构学 × AI × 视频链路的融合之路
  • 从零开始部署经典开源项目管理系统最新版redmine6-Linux Debian12
  • 粉刷房子(简单多状态dp问题)
  • 场外期权的股票停牌了怎么处理?
  • 226. 翻转二叉树
  • 《Unity Shader入门精要》学习笔记二
  • IOPaint 远程修图:cpolar 内网穿透服务实现跨设备图片编辑
  • 旧物回收小程序的商业变现路径探索
  • LeetCode 刷题【45. 跳跃游戏 II】
  • nuScence数据集
  • AI应用商业化加速落地 2025智能体爆发与端侧创新成增长引擎
  • 【2025CVPR-目标检测方向】RaCFormer:通过基于查询的雷达-相机融合实现高质量的 3D 目标检测
  • 机器学习(决策树)
  • 【音视频】瑞芯微、全志芯片在运动相机和行车记录仪产品分析
  • 从决策树基础到熵与信息增益
  • 机器学习的多种算法
  • 常见的光源频闪控制方式
  • 20. 云计算-Service MeshServerless
  • 用本地代理 + ZIP 打包 + Excel 命名,优雅批量下载跨域 PDF
  • 基于 ONNX Runtime 的 YOLOv8 高性能 C++ 推理实现
  • Pomian语言处理器 研发笔记(一):使用C++的正则表达式构建词法分析器
  • 浅谈 Python 正则表达式中的 groups()
  • GitLab 安全漏洞 CVE-2025-7739 解决方案
  • GitLab 安全漏洞 CVE-2025-6186 解决方案
  • Mind GPT:理想汽车发布的多模态大模型
  • Day119 持续集成docker+jenkins
  • 汽车企业顾客满意度调查:全周期反馈解码方案(市场调研实践)