当前位置: 首页 > article >正文

北京大气污染PM2.5预测(LSTM)

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
data = pd.read_excel('./北京空气_2010.1.1-2014.12.31.xlsx')

在这里插入图片描述
数据处理:把PM2.5 为null的数据都用相邻的数据填充,我们取2010年1月2日以后的数据。

data = data.iloc[24:].fillna(method = 'ffill')

在这里插入图片描述
把年,月,日 和小时 合并为一列。

import datetime
data['时间'] = data.apply(lambda x: datetime.datetime(year=x['年'],month =x['月'],day = x['日'],hour = x['小时']),axis = 1)

在这里插入图片描述
去掉 年,月,日 和小时,并且把 时间列 作为索引index

data.drop(columns=['No','年','月','日','小时'],inplace = True)
data = data.set_index('时间')

在这里插入图片描述
One-hot 编码 风向序列

data = data.join(pd.get_dummies(data.风向))
del data['风向']

在这里插入图片描述
查看2012年到2014年的

data['pm2.5'][-365*24:].plot()
data['pm2.5'][-365*24*2:-365*24].plot()
data['pm2.5'][-365*24*3:-365*24*2].plot()

在这里插入图片描述
用前6天的数据预测第7天的大气PM2.5

sequence_length = 6*24
delay = 24
data_ = []
for i in range(len(data) - sequence_length - delay):data_.append(data.iloc[i: i + sequence_length + delay])
data_ = np.array([df.values for df in data_])
np.random.shuffle(data_)
x = data_[:, :-delay, :]
y = data_[:, -1, 0]

把数据的80%分成训练集合,20%分为测试集合。

split_boundary = int(data_.shape[0] * 0.8)
train_x = x[: split_boundary]
test_x = x[split_boundary:]train_y = y[: split_boundary]
test_y = y[split_boundary:]

对数据进行归一化操作

mean = train_x.mean(axis=0) #均值
std = train_x.std(axis=0) #标准差
train_x = (train_x - mean)/std
test_x = (test_x - mean)/std

定义模型

model_m = keras.Sequential()
model_m.add(layers.LSTM(32, input_shape=(train_x.shape[1:]), return_sequences=True))
model_m.add(layers.LSTM(32, return_sequences=True))
model_m.add(layers.LSTM(32))
model_m.add(layers.Dense(1))model_m.compile(optimizer=keras.optimizers.Adam(), loss='mae')
learning_rate_reduction = keras.callbacks.ReduceLROnPlateau(monitor='val_loss', patience=3, factor=0.5, min_lr=0.00001)

训练模型

history = model_m.fit(train_x, train_y,batch_size = 128,epochs=200,validation_data=(test_x, test_y),callbacks=[learning_rate_reduction])

保存模型

model_m.save("MULTI_LAYERS_LSTM.h5")

测试模型准确度

data_test = data[-24*6:]
data_test = (data_test - mean)/std
data_test = data_test.to_numpy()
data_test = np.expand_dims(data_test,0)
pm = model_m.predict(data_test)

在这里插入图片描述
根据历史数据可知道 北京在2015年1月1日 24时,也就是2015年1月2日 0时的PM2.5 值为 51,我们预测的值为54.329.在这里插入图片描述

https://www.aqistudy.cn/historydata/daydata.php?city=%E5%8C%97%E4%BA%AC&month=2015-01
部分数据集
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/2413785.html

相关文章:

  • 《安卓最佳免费应用》
  • Windows Hook 易核心编程(4) API Hook 续 拦截API
  • 非常全面的DolphinScheduler(海豚调度)安装使用文档
  • Redhat Linux 9/AS 3上安装清华紫光拼音输入法智能五笔全拼等
  • 网络速度变慢的常见23种解决方法
  • A start job is running for /etc/rc.d/rc.local ... ... no limit
  • 微云秒点七级图标。
  • 十六条超炫代码让你的QQ空间改头换面(转)
  • 应用本地数据库
  • 嗜血法医第一二三季/Dexter全集迅雷下载
  • 梦幻西游默认服务器怎么修改器,梦幻西游古龙服务端安装教程
  • vs2008在打了SP1补丁后编译版本不匹配,导致“应用程序配置不正确,应用程序未能启动
  • java移位操作_java 移位运算
  • 春节灯谜及答案
  • 探秘雀魂智能助手:majsoul_wrapper项目深度剖析
  • SQuirrel SQL Client数据库连接工具的配置与使用
  • 精品PHP实现的博客网站的设计与实现
  • android权限(permission)大全
  • 1kb病毒解决方案
  • u盘低级格式化数据怎么恢复,u盘低级格式化还能恢复吗
  • FBReader源码分析之序言篇
  • 百度搜索下拉框,下拉菜单怎么做?如何刷?
  • android 4.1.2 菜单键,无惊喜功能!Android 4.1.2系统更新内容详解
  • 什么是树莓派(Raspberry Pi)
  • HTC G14(G18)刷MIUI详细刷机教程
  • Windows系统丢失olepro32.dll文件导致程序异常的问题
  • [经验栈]C#中几种定时器(timer)的区别
  • 团队拓展--真人CS团队战游戏拓展
  • 智能ABC知多少?
  • linux 下怎么将可执行文件做成镜像 开机就能运行这个可执行文件,基于Linux源代码及Busybox源代码制作精简可启动内核镜像技术实验方法...