当前位置: 首页 > news >正文

Facebook 开源多季节性时间序列数据预测工具:Prophet 快速入门 Quick Start

文中内容仅限技术学习与代码实践参考,市场存在不确定性,技术分析需谨慎验证,不构成任何投资建议。

Facebook Prophet
Prophet 是一种基于加法模型的时间序列数据预测程序,在该模型中,非线性趋势与年、周、日季节性以及节假日效应相匹配。它最适用于具有强烈季节效应和多季历史数据的时间序列。先知对缺失数据和趋势变化具有很强的鲁棒性,通常能很好地处理异常值。

Prophet 是 Facebook 核心数据科学团队发布的开源软件。

快速开始

Python API

Prophet 遵循 sklearn 的模型 API。我们创建一个 Prophet 类的实例,然后调用它的 fitpredict 方法。

Prophet 的输入总是一个包含两列的数据框:dsyds(日期戳)列应为 Pandas 期望的格式,理想情况下是日期的 YYYY-MM-DD 或时间戳的 YYYY-MM-DD HH:MM:SSy 列必须是数值型,表示我们希望预测的测量值。

举个例子,我们来看 Peyton Manning 维基百科页面的每日浏览量的对数时间序列。我们使用 R 中的 Wikipediatrend 包抓取这些数据。Peyton Manning 提供了一个很好的示例,因为它展示了 Prophet 的一些特性,例如多重季节性、变化的增长率以及建模特殊日期(如 Manning 的季后赛和超级碗出场)的能力。CSV 文件可在此处获取。

首先,我们导入数据:

# Python
import pandas as pd
from prophet import Prophet
# Python
df = pd.read_csv('https://raw.githubusercontent.com/facebook/prophet/main/examples/example_wp_log_peyton_manning.csv')
df.head()
DSY
02007-12-109.590761
12007-12-118.519590
22007-12-128.183677
32007-12-138.072467
42007-12-147.893572

我们通过实例化一个新的 Prophet 对象来拟合模型。任何预测过程的设置都传递给构造函数。然后调用其 fit 方法并传入历史数据框。拟合应耗时 1-5 秒。

# Python
m = Prophet()
m.fit(df)

预测是在具有包含待预测日期的 ds 列的数据框上进行的。您可以使用辅助方法 Prophet.make_future_dataframe 获取一个扩展到未来指定天数的合适数据框。默认情况下,它还将包括历史日期,因此我们将看到模型拟合情况。

# Python
future = m.make_future_dataframe(periods=365)
future.tail()
DS
32652017-01-15
32662017-01-16
32672017-01-17
32682017-01-18
32692017-01-19

predict 方法将为 future 中的每一行分配一个预测值,该值被命名为 yhat。如果您传入历史日期,它将提供样本内拟合。这里的 forecast 对象是一个新的数据框,包括带有预测的 yhat 列,以及组件和不确定性区间的列。

# Python
forecast = m.predict(future)
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()
DSYHATYHAT_LOWERYHAT_UPPER
32652017-01-158.2126257.4563108.959726
32662017-01-168.5376357.8429869.290934
32672017-01-178.3250717.6008799.072006
32682017-01-188.1577237.5120528.924022
32692017-01-198.1696777.4124738.946977

您可以通过调用 Prophet.plot 方法并传入预测数据框来绘制预测图。

# Python
fig1 = m.plot(forecast)

img

如果您想查看预测组件,可以使用 Prophet.plot_components 方法。默认情况下,您将看到时间序列的趋势、年度季节性和周季节性。如果您包括节假日,您也会在这里看到它们。

# Python
fig2 = m.plot_components(forecast)

img

可以使用 plotly 创建预测和组件的交互式图表。您需要单独安装 plotly 4.0 或更高版本,因为它不会默认随 prophet 安装。您还需要安装 notebookipywidgets 包。

# Python
from prophet.plot import plot_plotly, plot_components_plotlyplot_plotly(m, forecast)
# Python
plot_components_plotly(m, forecast)

每个方法可用选项的更多详细信息可在文档字符串中找到,例如,通过 help(Prophet)help(Prophet.fit)

R API

在 R 中,我们使用常规的模型拟合 API。我们提供了一个执行拟合并返回模型对象的 prophet 函数。然后您可以在此模型对象上调用 predictplot

# R
library(prophet)
R[write to console]: Loading required package: RcppR[write to console]: Loading required package: rlang

首先,我们读取数据并创建结果变量。与 Python API 一样,这是一个具有 dsy 列的数据框,分别包含日期和数值。ds 列应为日期的 YYYY-MM-DD 或时间戳的 YYYY-MM-DD HH:MM:SS。如上所述,我们在这里使用 Peyton Manning 维基百科页面的对数浏览量,可在此处获取。

# R
df <- read.csv('https://raw.githubusercontent.com/facebook/prophet/main/examples/example_wp_log_peyton_manning.csv')

我们调用 prophet 函数来拟合模型。第一个参数是历史数据框。其他参数控制 Prophet 如何拟合数据,并在本文档的后续页面中描述。

# R
m <- prophet(df)

预测是在具有包含待预测日期的 ds 列的数据框上进行的。make_future_dataframe 函数接受模型对象和要预测的周期数,并生成一个合适的数据框。默认情况下,它还将包括历史日期,以便我们可以评估样本内拟合。

# R
future <- make_future_dataframe(m, periods = 365)
tail(future)
             ds
3265 2017-01-14
3266 2017-01-15
3267 2017-01-16
3268 2017-01-17
3269 2017-01-18
3270 2017-01-19

与 R 中的大多数建模过程一样,我们使用通用的 predict 函数来获取我们的预测。forecast 对象是一个包含预测值 yhat 列的数据框。它具有用于不确定性区间和季节性组件的附加列。

# R
forecast <- predict(m, future)
tail(forecast[c('ds', 'yhat', 'yhat_lower', 'yhat_upper')])
             ds     yhat yhat_lower yhat_upper
3265 2017-01-14 7.818359   7.071228   8.550957
3266 2017-01-15 8.200125   7.475725   8.869495
3267 2017-01-16 8.525104   7.747071   9.226915
3268 2017-01-17 8.312482   7.551904   9.046774
3269 2017-01-18 8.145098   7.390770   8.863692
3270 2017-01-19 8.156964   7.381716   8.866507

您可以使用通用的 plot 函数通过传入模型和预测数据框来绘制预测图。

# R
plot(m, forecast)

img

您可以使用 prophet_plot_components 函数将预测分解为趋势、周季节性和年度季节性。

# R
prophet_plot_components(m, forecast)

img

可以使用命令 dyplot.prophet(m, forecast) 使用 Dygraphs 创建预测的交互式图表。

每个方法可用选项的更多详细信息可在文档字符串中找到,例如,通过 ?prophet?fit.prophet。该文档也可在 CRAN 上的参考手册中找到。

风险提示与免责声明
本文内容基于公开信息研究整理,不构成任何形式的投资建议。历史表现不应作为未来收益保证,市场存在不可预见的波动风险。投资者需结合自身财务状况及风险承受能力独立决策,并自行承担交易结果。作者及发布方不对任何依据本文操作导致的损失承担法律责任。市场有风险,投资须谨慎。

http://www.lryc.cn/news/594011.html

相关文章:

  • Centos卷挂载失败系统无法启动
  • 【Java项目安全基石】登录认证实战:Session/Token/JWT用户校验机制深度解析
  • Android系统5层架构
  • 手推OpenGL相机的正交投影矩阵和透视投影矩阵(附源码)
  • Java 大视界 -- Java 大数据在智能安防门禁系统中的权限动态管理与安全审计(353)
  • LeetCode第337题_打家劫舍III
  • 如何实战优化SEO关键词提升百度排名?
  • SQL Server(2022)安装教程及使用_sqlserver下载安装图文
  • python的pywebview库结合Flask和waitress开发桌面应用程序简介
  • Flink2.0学习笔记:Table API SQL
  • 基于单片机的智能家居安防系统设计
  • GaussDB 数据库架构师修炼(七) 安全规划
  • 【k8s集群管理平台】k8s运维管理的新玩法,让运维电脑随时不离身的现状成为过去
  • 基于机器视觉的迈克耳孙干涉环自动计数系统设计与实现
  • 后台管理系统登录模块(双token的实现思路)
  • 【硬件】GalaxyTabPro10.1(SM-T520)刷机/TWRP/LineageOS14/安卓7升级小白向保姆教程
  • ThinkPHP8极简上手指南:开启高效开发之旅
  • AXI接口
  • HTML和CSS快速入门
  • 相似度计算
  • Golang的微服务链路追踪
  • Unity笔记——Unity 封装方法指南
  • AS32X601 系列 MCU 硬件最小系统设计与调试方案探析
  • 神经网络:池化层
  • 从零开始开发纯血鸿蒙应用之跨模块路由
  • OpenCV 入门知识:图片展示、摄像头捕获、控制鼠标及其 Trackbar(滑动条)生成!
  • Ubuntu 24.04 设置静态 IP 的方法
  • Linux操作系统之线程(四):线程控制
  • HarmonyOS 启动提速秘籍:懒加载全链路实战解析
  • 反序列化漏洞4-Thinkphp5.4靶场安装及Thinkphp反序列化漏洞任意文件删除演示