当前位置：首页 > news >正文

【22-决策树】

news 2025/8/15 13:38:45

决策树和树集成 decisiontrees and tree ensembles

决策树定义

决策树的工作原理

例子：猫分类，在一家猫咪收留中心，需要训练一个分类器快速地识别一个动物是否是猫；

输入特征：耳朵形状（尖的pointy 耷拉的floppy）；脸形状；胡须whiskers；输出：是否是猫；

什么是决策树？

使用决策树学习算法对数据集进行训练后得到的模型，看起来像一棵树；树最顶端的叫根节点；椭圆型的叫决策节点，矩形框叫叶节点，用作输出预测结果；

除了示例的决策树，实际上还存在其他很多种决策树，它们根据每种特征的值做不同的选择，走不同的分支；这些决策树有些在测试数据集上表现地好，有些表现地差。

所以决策树学习算法的任务是，从所有可能的决策树中，选择一个在训练集上表现最好，并且泛化能力较强的决策树。

如何让算法根据训练集学习一个特定的决策树？

决策树的训练

构建决策树

对于给定一个训练集，构建决策树有几个步骤

1、决定在根节点使用哪个特征，选择在子节点使用哪个特征，然后尽可能将示例数据集全部分开（cat & not cat）；

如何选择特征来拆分数据集；选择那些尽可能能将猫和其他动物区分开来的特征；区分之后的纯度尽可能高；

决策树学习算法必须在耳朵形状、脸型、胡须之间做选择，

熵entropy，如何估计杂质以及最小化杂质；

2、何时停止划分？

当一个节点全部为猫/非猫；

当拆分节点会导致树达到最大深度；节点的深度：从根节点到达该节点所需的步数；

当提高纯度得分超过了阈值；

当节点的示例数量低于某阈值；

限制树的深度：确保树不会太大，便于管理；保持小规模，以避免过拟合；

在一个节点上如何划分

熵，entropy，描述节点不纯度的一种说法；

一组数据全是猫/全不是猫，则纯度很高；

p1：一组中猫占的比例；

当p1 = 0.5时，即一半一半时，不纯度最高；

查看全文

http://www.lryc.cn/news/621235.html

零基础-动手学深度学习-10.3. 注意力评分函数

20道CSS相关前端面试题及答案

torch.nn中Sequential的使用

【代码随想录day 20】力扣 538.把二叉搜索树转换为累加树

CMake语法与Bash语法的区别

扩展用例-失败的嵌套

流式数据服务端怎么传给前端，前端怎么接收？

jenkins在windows配置sshpass

设计模式笔记_行为型_状态模式

【JavaEE】多线程 -- 线程状态

纸箱拆垛：物流自动化中的“开箱密码”与3D视觉的智能革命

面试题之项目中灰度发布是怎么做的

Flink on YARN启动全流程深度解析

会议通信系统核心流程详解（底稿1）

Linux软件编程：进程和线程

C#面试题及详细答案120道（01-10）-- 基础语法与数据类型

Flink Stream API 源码走读 - socketTextStream

2025H1手游市场：SLG领涨、休闲爆发，何为出海新航道？

广告灯的左移右移

Day43 复习日

FPGA+护理：跨学科发展的探索（五）

Kotlin Data Classes 快速上手

【深度学习】深度学习基础概念与初识PyTorch

报数游戏（我将每文更新tips）

IPTV系统：开启视听与管理的全新篇章

14 ABP Framework 文档管理

【软考中级网络工程师】知识点之入侵防御系统：筑牢网络安全防线

SpringMVC（详细版从入门到精通）未完

P5967 [POI 2016] Korale 题解

【数据分享】2014-2023年长江流域（0.05度）5.5km分辨率的每小时日光诱导叶绿素荧光SIF数据

决策树定义

决策树的工作原理

决策树的训练

构建决策树

在一个节点上如何划分

相关文章：