当前位置: 首页 > news >正文

深度学习 Lecture 8 决策树

一、决策树模型(Decision Tree Model)

椭圆形代表决策节点(decison nodes),矩形节点代表叶节点(leaf nodes),方向上的值代表属性的值,

构建决策树的学习过程:

第一步:决定在根节点上的特征(也就是第一个分开样本的特征)

第二步:决定在内部节点上的特征(第二个、第三个分开样本的特征)

第三步:顺着特征写出特定的值的输出值

第一个问题:如何选择在每个节点上使用划分的特征呢?

尽量要保持最大的纯度(Maximize purity),纯度代表说,尽可能能直接完成分类(也就是尽量把这几个类的子集分开)

第二个问题:什么时候停止划分?

1. 当一个节点能百分百判断一个类的时候

2.当划分节点将会导致树超过最大深度时

3. 想避免过拟合时

二、测量纯度(Measuring purity)

熵:对一组数据不纯度的衡量

熵函数一般用H(p_1)表示

可以看到,当样本集是五五开的时候,这条曲线是最高的,也就是熵最大。

相反,如果样本集里都是猫或者都是狗的话,熵为0.

熵函数的方程:
 

 

http://www.lryc.cn/news/340079.html

相关文章:

  • 打包 docker 容器镜像到另一台电脑
  • 贪心算法--购买股票
  • 在Mac主机上连接Linux虚拟机
  • 前端如何单独做虚拟奖金池?
  • 前端md5校验文件
  • 总结SQL相对常用的几个字符函数
  • 云计算笔记
  • 网络安全学习路线-超详细
  • 【多模态检索】Coarse-to-Fine Visual Representation
  • VRRP——虚拟路由冗余协议
  • 隧道应急广播应该如何搭建?
  • OpenHarmony实战开发-Worker子线程中解压文件。
  • 中国科学院大学学位论文LaTeX模版
  • 秘塔和Kimi AI在资料查询和学习中的使用对比
  • apk反编译
  • 修改百度百科的词条的方法
  • 更改ip地址的几种方式有哪些
  • Flink学习(六)-容错处理
  • 设计模式(020)行为型之备忘录模式
  • Android 系统锁屏息屏休眠时Handler CountDownTimer计时器停止运行问题解决
  • Java中如何提取视频文件的缩略图
  • 总结 HashTable, HashMap, ConcurrentHashMap 之间的区别
  • 《剑指 Offer》专项突破版 - 面试题 107 : 矩阵中的距离(C++ 实现)
  • 揭秘智慧礼品背后的故事
  • NVM的安装与配置
  • [Java EE] 多线程(一) :线程的创建与常用方法(上)
  • Linux安装docker(含Centos系统和Ubuntu系统)
  • 【第十五届蓝桥杯大赛软件赛省赛】———— C/C++ 大学B组
  • Redis+lua脚本限制ip多次输入错误密码
  • 全球顶级的低代码开发平台,你知道几个?