当前位置：首页 > news >正文

Pandas 高级教程——高级时间序列分析

news 2025/9/13 5:59:43

Python Pandas 高级教程：高级时间序列分析

Pandas 提供了强大的时间序列处理功能，使得对时间序列数据进行高级分析变得更加灵活和方便。在本篇博客中，我们将深入介绍 Pandas 中的高级时间序列分析技术，并通过实例演示如何应用这些功能。

1. 安装 Pandas

确保你已经安装了 Pandas。如果尚未安装，可以使用以下命令：

pip install pandas

2. 导入 Pandas 库

在使用 Pandas 进行高级时间序列分析之前，导入 Pandas 库：

import pandas as pd

3. 创建示例数据

在学习高级时间序列分析之前，首先创建一个示例的时间序列数据：

# 创建示例数据
date_rng = pd.date_range(start='2022-01-01', end='2022-12-31', freq='D')
time_series_data = pd.DataFrame(date_rng, columns=['date'])
time_series_data['value'] = range(len(date_rng))

4. 设置时间索引

将日期列设置为时间索引：

# 设置时间索引
time_series_data.set_index('date', inplace=True)

5. 重采样

5.1 降采样

将数据从日频率降采样到月频率：

# 降采样到月频率
monthly_data = time_series_data.resample('M').sum()

5.2 升采样

将数据从日频率升采样到小时频率：

# 升采样到小时频率
hourly_data = time_series_data.resample('H').pad()

6. 移动窗口操作

6.1 移动平均

# 计算7天的移动平均
time_series_data['rolling_mean'] = time_series_data['value'].rolling(window=7).mean()

6.2 移动总和

# 计算30天的移动总和
time_series_data['rolling_sum'] = time_series_data['value'].rolling(window=30).sum()

7. 指数加权移动平均

# 计算指数加权移动平均
time_series_data['ewma'] = time_series_data['value'].ewm(span=30, adjust=False).mean()

8. 滞后和超前

8.1 滞后

# 滞后一期
time_series_data['lag_1'] = time_series_data['value'].shift(1)

8.2 超前

# 超前一期
time_series_data['lead_1'] = time_series_data['value'].shift(-1)

9. 季节性分解

from statsmodels.tsa.seasonal import seasonal_decompose# 季节性分解
result = seasonal_decompose(time_series_data['value'], model='additive', period=30)
trend = result.trend.dropna()
seasonal = result.seasonal.dropna()
residual = result.resid.dropna()

10. 自相关和偏自相关

10.1 自相关图

from statsmodels.graphics.tsaplots import plot_acf# 绘制自相关图
plot_acf(time_series_data['value'], lags=30)
plt.show()

10.2 偏自相关图

from statsmodels.graphics.tsaplots import plot_pacf# 绘制偏自相关图
plot_pacf(time_series_data['value'], lags=30)
plt.show()

11. 时间序列模型

from statsmodels.tsa.arima.model import ARIMA# 拟合 ARIMA 模型
model = ARIMA(time_series_data['value'], order=(1,1,1))
fit_model = model.fit()

12. Prophet 时间序列预测

from fbprophet import Prophet# 使用 Prophet 进行时间序列预测
prophet_model = Prophet()
prophet_model.fit(time_series_data.reset_index().rename(columns={'date': 'ds', 'value': 'y'}))
future = prophet_model.make_future_dataframe(periods=365)
forecast = prophet_model.predict(future)