当前位置: 首页 > news >正文

【Python机器学习】用于回归的决策树

用于回归的决策树与用于分类的决策树类似,在DecisionTreeRegressor中实现。DecisionTreeRegressor不能外推,也不能在训练数据范围之外的数据进行预测。

利用计算机内存历史及格的数据进行实验,数据展示:

import pandas as pd
import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']ram_price=pd.read_csv('ram_price.csv')
plt.semilogy(ram_price.date,ram_price.price)
plt.xlabel('年份')
plt.ylabel('价格')
plt.show()

利用2000年前的历史数据来预测2000年之后的价格,只用日期作为特征,对比决策树、线性模型的预测结果:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor
from sklearn.linear_model import LinearRegressionplt.rcParams['font.sans-serif'] = ['SimHei']
ram_price=pd.read_csv('ram_price.csv')
#plt.semilogy(ram_price.data,ram_price.price)
data_train=ram_price[ram_price.date<2000]
data_test=ram_price[ram_price.date>=2000]X_train=np.array(data_train)
#X_train=data_train.date[:, np.newaxis]
y_train=np.log(data_train.price)tree=DecisionTreeRegressor().fit(X_train,y_train)
line_reg=LinearRegression().fit(X_train,y_train)X_all = np.array(ram_price)
#X_all=ram_price.date[:,np.newaxis]
pred_tree=tree.predict(X_all)
pred_lr=line_reg.predict(X_all)price_tree=np.exp(pred_tree)
price_lr=np.exp(pred_lr)plt.semilogy(data_train.date,data_train.price,label='训练数据')
plt.semilogy(data_test.date,data_test.price,label='测试数据')
plt.semilogy(ram_price.date,price_tree,label='决策树预测')
plt.semilogy(ram_price.date,price_lr,label='线性预测')
plt.legend()
plt.show()

可以看到两个模型的差异非常明显。线性模型用一条直线对数据做近似,对2000年后的价格预测结果非常好,但忽略了训练数据和测试数据中一些更细微的变化。树模型则完美预测了训练数据,但一旦输入超过了模型训练数据的范围,模型就只能持续预测最后一个已知数据点。树不能在训练数据的范围之外生成新的响应,所有基于树的模型都有这个缺点。

http://www.lryc.cn/news/277285.html

相关文章:

  • numpy库的一些常用函数
  • 成员变量与局部变量的区别?
  • ES6---判断对象是否为{}
  • 高性能、可扩展、分布式对象存储系统MinIO的介绍、部署步骤以及代码示例
  • oracle重启数据库lsnrctl重启监听
  • 08、Kafka ------ 消息存储相关的配置-->消息过期时间设置、查看主题下的消息存活时间等配置
  • JAVA基础学习笔记-day15-File类与IO流
  • WPF ComboBox限制输入长度
  • windows配置网络IP地址的方法
  • windows配置电脑网络IP的方法
  • MySQL,原子性rename
  • FPGA之按键消抖
  • 国内知名的技术平台
  • C#操作注册表
  • Unity中BRP下的深度图
  • 物联网的感知层、网络层与应用层分享
  • kafka KRaft 集群搭建
  • oracle角色管理
  • 汽车信息安全--芯片厂、OEM安全启动汇总(2)
  • HarmonyOS 开发基础(五)Button
  • 带前后端H5即时通讯聊天系统源码
  • vsCode输出控制台中文乱码解决
  • 「服务器」4.新手小白如何安装服务器环境-宝塔
  • Docker安装MySql详细步骤
  • 【微服务合集】
  • Hadoop之mapreduce参数大全-2
  • 目标检测YOLO实战应用案例100讲-基于图像增强的鸟类目标检测(续)
  • MYSQL分表容量预估:简明指南
  • 面试宝典进阶之Java线程面试题
  • BOM简介