2.涉及一个端到端的时间序列预测解决方案
2.1 时间序列预测模版
模版包含不同的步骤:
1).业务理解和性能度量
2).数据摄取
3).数据探索和理解
4).数据预处理和特征工程缩进
5).模型构建和选择
6).模型部署
7).预测解决方案的接受程度
2.1.1 业务理解和性能度量
2.1.2 数据摄取
数据摄取有三种不同的方法:批处理、实时处理和流处理。
2.1.3 数据探索与理解
关于原始数据质量的几个考虑因素:
缺失值
测量准确率
测量时间
同步
延迟
2.1.4 数据预处理和特征工程
特征可以是基于数据集的两种主要类型:
1).固有的原始特征
2).衍生特征
a. 时间驱动特征:一天中的时间、星期、日期、月份、周末、假日、傅里叶项
b.独立的测量特征:滞后特征,长期趋势,
c.依赖特征
2.1.5 模型构建和选择
数据集分割:训练集、验证集和测试集
2.2 需求预测建模技术概述
a.移动平均(MA)
b.指数平滑
c.差分自回归移动平均(ARIMA)模型
d.一般多元回归