时间序列预测的自回归方法
时间序列预测的自回归方法
自回归
自回归(AR)模型基于"历史会重复"的假设,认为当前值是过去若干期值的线性组合。其核心公式为:
Xt=c+∑i=1pϕiXt−i+εt X_t = c + \sum_{i=1}^p \phi_i X_{t-i} + \varepsilon_t Xt=c+i=1∑pϕiXt−i+εt
参数含义:
- ppp:自回归阶数(考虑的历史观测值数量)
- ϕi\phi_iϕi:第i阶自回归系数(历史值对当前值的影响权重)
- ccc:常数项(序列的基准水平)
- εt\varepsilon_tεt:白噪声(均值为0的随机误差)
适用场景:
- 平稳时间序列(统计特性不随时间变化)
- 短期预测(如股票日内波动)
- 温度、电力负荷等具有持续性的序列
优劣性:
✓ 计算简单,解释性强
✓ 对短期依赖关系建模有效
✗ 无法处理趋势和季节性
✗ 要求序列必须平稳
移动平均
移动平均(Moving Average Model, MA)与AR模型互补,其核心是通过历史误差项(白噪声)的线性组合来解释当前观测值的波动。与AR模型关注"历史值的影响"不同,MA模型更侧重"历史随机扰动的影响",其表达式为:
Xt=μ+εt+∑i=1qθiεt−i X_t = \mu + \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i} Xt=μ+εt+i=1∑qθiεt−i
参数含义:
- qqq:移动平均阶数(考虑的历史误差项数量)
- θi\theta_iθi:第i阶移动平均系数(历史误差对当前值的影响权重)
- μ\muμ:序列均值(长期平均水平)
- εt\varepsilon_tεt:当前时刻的白噪声误差
适用场景:
- 含随机冲击的序列(如受新闻影响的股价)
- 噪声主导的工业传感器数据
- 残差分析(与其他模型组合时)
优劣性:
✓ 有效捕捉突发性波动
✓ 对异常值较鲁棒
✗ 单独使用预测能力有限
✗ 难以解释长期模式
自回归移动平均
自回归移动平均(Autoregressive Moving Average Model, ARMA)是AR模型与MA模型的结合,同时考虑历史观测值和历史误差项对当前值的影响。ARMA模型适用于平稳时间序列(即均值、方差和自协方差不随时间变化):
Xt=c+∑i=1pϕiXt−i+εt+∑j=1qθjεt−j X_t = c + \sum_{i=1}^p \phi_i X_{t-i} + \varepsilon_t + \sum_{j=1}^q \theta_j \varepsilon_{t-j} Xt=c+i=1∑pϕiXt−i+εt+j=1∑qθjεt−j
参数含义:
- ppp:自回归阶数(AR部分)
- qqq:移动平均阶数(MA部分)
- ϕi\phi_iϕi:第i阶自回归系数
- θj\theta_jθj:第j阶移动平均系数
- ccc:常数项(序列基准值)
适用场景:
- 金融收益率预测
- 平稳的销售数据
- 短期经济指标预测
优劣性:
✓ 统一框架处理序列依赖和随机冲击
✓ 参数经济性(参数较少)
✗ 仍要求严格平稳性
✗ 对长期趋势建模能力弱
差分自回归移动平均
差分自回归移动平均(Autoregressive Integrated Moving Average Model, ARIMA)是ARMA模型的扩展,专门用于处理非平稳时间序列。其核心思想是通过差分操作(Differencing)消除序列的非平稳性(如趋势或季节性),再对差分后的平稳序列应用ARMA模型:
(1−∑i=1pϕiBi)(1−B)dXt=c+(1+∑j=1qθjBj)εt (1-\sum_{i=1}^p \phi_i B^i)(1-B)^d X_t = c + (1+\sum_{j=1}^q \theta_j B^j)\varepsilon_t (1−i=1∑pϕiBi)(1−B)dXt=c+(1+j=1∑qθjBj)εt
参数含义:
- ppp:自回归阶数
- ddd:差分阶数(使序列平稳所需的差分次数)
- qqq:移动平均阶数
- BBB:滞后算子(BXt=Xt−1BX_t = X_{t-1}BXt=Xt−1)
- (1−B)d(1-B)^d(1−B)d:d阶差分算子
适用场景:
- 具有趋势的序列(GDP增长)
- 季节性调整后的数据
- 运输量、能源消耗等宏观指标
优劣性:
✓ 处理非平稳序列的金标准
✓ 扩展性强(可衍生SARIMA等)
✗ 差分可能导致信息损失
✗ 参数选择复杂(需反复试验)