数据清洗-缺失值填充-对XGBoost参数优化填充
目录
- 一、安装所需的python包
- 二、采用XGboost算法进行缺失值填充
- 2.1可直接运行代码
- 2.2以某个缺失值数据进行实战
- 2.2.1 代码运行过程截屏:
- 2.2.2 填充后的数据截屏:
- 三、网格搜索(Grid Search)对 XGBoost 模型的超参数进行优化原理介绍
- 3.1 说明
- 3.2 参数优化的原理
- 1. 网格搜索(Grid Search)
- 2. 交叉验证(Cross-Validation)
- 3. XGBoost 模型的超参数
- 4. 预测缺失值
- 3.3 整体优化效果
- 3.4 输出与保存
- 四、XGBoost算法原理介绍
- 4.1 XGBoost 的定义
- 4.2 XGBoost 的核心思想
- 4.3 XGBoost 的特点
- 4.4 XGBoost 的工作原理
- 4.5 XGBoost 的损失函数
- 4.6XGBoost 的参数
- 4.7 XGBoost 的应用场景
- 4.8XGBoost 的优缺点
- 4.8.1 优点
- 4.8.2 缺点
感觉大家对原理性的东西不太感兴趣,那我就直接举例提供代码,以及详细的注释,大家自己对照改代码应用于你自己建立的模型吧。
这些代码全部是我自己做数模竞赛时候自己用的代码。可以直接运行,记得修改文件路径。
一、安装所需的python包
pip install pandas
pip install numpy
pip install scikit-learn
pip install xgboost
二、采用XGboost算法进行缺失值填充
注意代码需要把自己的数据文件格式转换为CSV文件,并且把路径修改为自己文件所在的路径,不会转换的参考我此教程文件格式转换:EXCEL和CSV文件格式互相转换。
我知道大家对原理性的东西不感兴