当前位置: 首页 > news >正文

第8章:集成学习

个体与集成

在这里插入图片描述

  • 同质:相同的基学习器,实现容易,但是很难保证差异性。
  • 异质:不同的基学习器,实现复杂,不同模型之间本来就存在差异性,但是很难直接比较不同模型的输出,需要复杂的配准方法。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
好而不同
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

boosting

在这里插入图片描述

在这里插入图片描述

Adaboost

在这里插入图片描述
在这里插入图片描述

求解h

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

求解alpha

在这里插入图片描述
在这里插入图片描述

bagging

在这里插入图片描述

随机森林

数据集划分:使用类似自助法的k折交叉验证,有放回的取出,分别训练T个决策树。
随机:一个是训练集的随机,一个是属性的随机(每次在当前属性中随机取K个构成属性子集,在子集中选择信息增益最大的属性)
在这里插入图片描述

结合策略

集合的好处

  • 可能多个假设在训练集上达到同等性能,使用单学习器可能因为误选而导致泛化性能不佳。
  • 单个可能陷入局部极小点。
  • 可以使相应的假设空间扩大。

结合方法

平均法

  • 简单平均
  • 加权平均

投票法

  • 绝对多数投票(大于一半则预测为该标记,否则拒绝)
  • 相对多数投票
  • 加权投票法

学习法

利用初始数据集训练出初级学习器,然后生成一个新数据集,训练一个次级学习器。

多样性增强

  • 数据样本扰动
  • 输入属性扰动
  • 输出表示扰动
  • 算法参数扰动
http://www.lryc.cn/news/131280.html

相关文章:

  • 设计HTML5列表和超链接
  • React Native 环境搭建
  • 【uniapp】中 微信小程序实现echarts图表组件的封装
  • AgentBench::AI智能体发展的潜在问题(三)
  • zookeeper-安装部署
  • jvm-运行时数据区概述及线程
  • 石头IT
  • R语言dplyr包select函数删除dataframe数据中包含指定字符串内容的数据列(drop columns in dataframe)
  • [GitOps]微服务版本控制:使用ArgoCD 部署Grafana Loki
  • 什么是单例模式
  • 【Linux从入门到精通】动静态库的原理与制作详解
  • 【mybatis】mapper.xml中foreach的用法,含批量查询、插入、修改、删除方法的使用
  • c#扩展方法的使用
  • rhel 8.7 部署 keepalived+haproxy 实现 mysql 双主高可用场景
  • 常见指令以及权限理解
  • OpenCV基础知识(6)— 滤波器
  • IOC容器的基础功能设计模式
  • FFmpeg参数说明FFmpegAndroid饺子视频播放器
  • DNS入门学习:DNS解析生效问题(中科三方)
  • Ubuntu22.04编译安装Mysql5.7.35
  • C++音乐播放系统
  • Django笔记之log日志记录详解
  • vue局部打印多页面pdf
  • 指定或降低Rust 工具链的版本
  • 数据驱动成功:商城小程序分析与改进
  • 基于GUI的卷积神经网络和长短期神经网络的语音识别系统,卷积神经网的原理,长短期神经网络的原理
  • Docker环境安装elasticsearch和kibana
  • 【剖析STL】vector
  • Redis、Memcache和MongoDB的区别
  • 2023中大ACM游记