当前位置: 首页 > news >正文

机器学习2:决策树--基于信息增益的ID3算法

1.决策树的简介

 

建立决策树的过程可以分为以下几个步骤:

  1. 计算每个特征的信息增益或信息增益比,选择最优的特征作为当前节点的划分标准。
  2. 根据选择的特征将数据集划分为不同的子集。
  3. 对每个子集递归执行步骤 1 和步骤 2,直到满足终止条件。
  4. 构建决策树,并输出。

基于信息增益的ID3算法;

ID3算法:

  1. 计算每个特征的信息增益。信息增益 = H(D) - H(D|A),其中H(D)是样本的熵,H(D|A)是在特征A给定的条件下样本的条件熵。
  2. 选择信息增益最大的特征作为当前节点的划分标准。
  3. 对每个特征值创建一个子节点,并递归地执行步骤 1 和步骤 2。

(1)信息熵的计算

案例1

案例2

(2)信息增益 Gain

 

案例1 

 

http://www.lryc.cn/news/215431.html

相关文章:

  • centos7完全卸载和安装mysql8
  • 常用的解析XML的开源库
  • SQLITE3 函数接口
  • RISC-V IDE MRS无感远程协助模块详解
  • APA技术方案及关键点
  • WordPress外链页面安全跳转插件
  • 【牛客网】安全—加密和安全
  • Mybatis基础操作
  • Java实验二类编程实验
  • css文本溢出省略号多行单行例子详细
  • android auto
  • opengl基础笔记1
  • Flutter中的各种刷新小部件
  • DataxWeb安装部署及使用--真香警告
  • OpenCV 笔记(4):图像的算术运算、逻辑运算
  • 创建ABAP数据库表和ABAP字典对象-使用已存在的数据元素增加城市字段04
  • Centos7上安装 Node.js
  • 栈及其栈的模拟实现和使用
  • HarmonyOS开发:开源一个刷新加载组件
  • XSSFWorkbook读取模板,批量填充并导出文件
  • Lazada新店运营秘籍自养号测评技术
  • python:逐像素处理遥感数据时间序列数据(求时间序列最大值、最大值所对应的索引、最大值所在的时间)
  • SpringCloudGateway--过滤器(自定义filter)
  • 【docker】安装 showdoc
  • 智慧公厕:科技赋予公共卫生新生命,提升城市管理品质
  • 深度学习_2 数据操作之数据预处理
  • 在美团和阿里6年,很难却也真实...
  • 2、NLP文本预处理技术:词干提取和词形还原
  • Fabric官方示例测试网络搭建
  • ubuntu20.04 conda pack 打包虚拟环境,直接将其用到其他终端