当前位置: 首页 > news >正文

《机器学习by周志华》学习笔记-决策树-02

1、剪枝处理(Pruning)

1.1、背景概念

上文「决策树01」的学习中,我们了解了著名的3种决策树算法ID3、C4.5、CART。这3种决策树算法最根本的核心就是根据特征选择离散属性作为节点来搭建树结构,运用搭好的结构进行推理。

剪枝(pruning)则就是将搭好的决策树去掉一些「非叶节点」的过程。

1.2、作用

解决推理时出现「过拟合」的问题。

过拟合介绍:

为了尽可能的正确分类训练样本,节点划分过程不断重复,有时会造成决策树分支过多,这时候就是训练的「太好」了,以至于把训练集自身的一些特点,当作所有数据都具有的一般性质,导致出现了「过拟合」

所以我们可以通过「剪枝(pruning)」来降低过拟合风险。

「过拟合」一般会出现在CART算法中。

1.3、实施方法策略

1.3.1、预剪枝策略(prepruning)

1.3.1.1、概念

是指在决策树生成过程中,对每个节点在划分前进行估计:

若当前结点的划分不能带来决策树泛化性能的提升,则停止划分并将当前结点标记为叶节点。

如何判断决策树泛化性能是否提升?

我们在上文「模型评估与选择」中可以求得泛化性能的指标。本节我们使用「留出法」,即预留一部分数据用作「验证集」以进行性能评估。

例如:

西瓜数据集D
编号色泽(A1)根蒂(A2)敲声(A3)纹理(A4)脐部(A5)触感(A6)是否好瓜(Y)
x1青绿A_{1}^{1}蜷缩A_{2}^{1}浑浊A_{3}^{1}清晰A_{4}^{1}凹陷A_{5}^{1}硬滑A_{6}^{1}是Y1
x2乌黑A_{1}^{2}蜷缩A_{2}^{1}沉闷A_{3}^{2}清晰A_{4}^{1}凹陷A_{5}^{1}硬滑A_{6}^{1}是Y1
x3乌黑A_{1}^{2}蜷缩A_{2}^{1}浑浊A_{3}^{1}清晰A_{4}^{1}凹陷A_{5}^{1}硬滑A_{6}^{1}是Y1
x4青绿A_{1}^{1}蜷缩A_{2}^{1}沉闷A_{3}^{2}清晰A_{4}^{1}凹陷A_{5}^{1}硬滑A_{6}^{1}是Y1
x5浅白A_{1}^{3}蜷缩A_{2}^{1}浑浊A_{3}^{1}清晰A_{4}^{1}凹陷A_{5}^{1}硬滑A_{6}^{1}是Y1
x6青绿A_{1}^{1}稍蜷A_{2}^{2}浑浊A_{3}^{1}清晰
http://www.lryc.cn/news/416030.html

相关文章:

  • centos Python3.6升级3.8
  • 文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《基于竞价空间预测的虚拟电厂日前竞价策略》
  • Simulink模型开发中的一些自动化方法
  • RabbitMQ消费者消费消息失败处理
  • Apache Kylin分布式的分析数据仓库
  • informer中DeltaFIFO机制的实现分析与源码解读
  • 树莓派下,centos7amr64下,搭建目标检测开发环境,java语言
  • SpringBoot+Redis 发布与订阅
  • huggingface无法访问怎么办?一招教你解决,使用hf-mirror.com镜像站快速下载各种大模型
  • 如何用密码保护你的 WordPress 管理员 (wp-admin) 目录
  • java 程序包org.junit.jupiter.api不存在
  • 简单的docker学习 第4章 docker容器
  • 零基础入门转录组数据分析——机器学习算法之SVM-RFE(筛选特征基因)
  • Python酷库之旅-第三方库Pandas(067)
  • Spring快速学习
  • 【Web开发手礼】探索Web开发的秘密(十五)-Vue2(2)AJAX、前后端分离、前端工程化
  • Phalco安装过程以及踩的一些坑(mac环境)
  • Ubuntu修改双系统默认启动顺序
  • 高仲富:49岁搞AI,白天种菜卖菜,晚上学数学搞程序
  • 光线追踪(纹理映射)
  • 传统产品经理VS现在AI产品经理,你要学习的太多了,超详细收藏我这一篇就够了
  • C#使用Socket实现TCP服务器端
  • MTK联发科MT8766/MT8166安卓核心板性能参数对
  • ps绘制动图
  • AI学习指南机器学习篇-强化学习和深度学习简介
  • yolov8 bytetrack onnx模型推理
  • ImageNet数据集和CIFAR-10数据集
  • Go语言编程大全,web微服务数据库十大专题精讲
  • 【LabVIEW学习篇 - 13】:队列
  • 大语言模型综述泛读之Large Language Models: A Survey