当前位置: 首页 > news >正文

阅读笔记DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks

zi,t∈Rz_{i,t}\in \mathbb{R}zi,tR表示时间序列iiittt时刻的值。给一个连续时间段t∈[1,T]t\in [1, T]t[1,T],将其划分为context window[1,t0)[1,t_0)[1,t0)和prediction window[t0,T][t_0,T][t0,T]。用context window的时间序列预测prediction window的时间序列的目标分布是
P(zi,t0:T∣zi,1:t0−1,xi,1:T)P(\mathbf z_{i,t_0:T} | \mathbf z_{i,1:t_0-1}, \mathbf x_{i,1:T}) P(zi,t0:Tzi,1:t01,xi,1:T)其中xi,t\mathbf x_{i,t}xi,t是协变量(covariate),也就是特征,可以是时间相关的,也可以是序列相关的,比如day-of-the-week、hour-of-the-day等。
作者用自回归(autoregressive)模型建模上面时间序列的概率:
QΘ(zi,t0:T∣zi,1:t0−1,xi,1:T)=Πt=t0TQΘ(zi,t∣zi,1:t−1,xi,1:T)=Πt=t0Tl(zi,t∣θ(hi,t,Θ))Q_\Theta(\mathbf z_{i,t_0:T} | \mathbf z_{i,1:t_0-1}, \mathbf x_{i,1:T})=\Pi_{t=t_0}^TQ_\Theta(z_{i,t} | \mathbf z_{i,1:t-1}, \mathbf x_{i,1:T}) = \Pi_{t=t_0}^T l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta)) QΘ(zi,t0:Tzi,1:t01,xi,1:T)=Πt=t0TQΘ(zi,tzi,1:t1,xi,1:T)=Πt=t0Tl(zi,tθ(hi,t,Θ))其中hi,t=h(hi,t−1,zi,t−1,xi,t,Θ)\mathbf h_{i,t} = h(\mathbf h_{i,t-1}, z_{i, t-1}, \mathbf x_{i,t}, \Theta)hi,t=h(hi,t1,zi,t1,xi,t,Θ)是RNN的隐含表示。likelihood l(zi,t∣θ(hi,t,Θ))l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta))l(zi,tθ(hi,t,Θ))是一个分布,参数由θ(hi,t,Θ)\theta(\mathbf h_{i,t}, \Theta)θ(hi,t,Θ)给出。
在这里插入图片描述

likelihood l(zi,t∣θ(hi,t,Θ))l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta))l(zi,tθ(hi,t,Θ))的参数由网络预测,例如分布的mean和variance。具体地,作者对实数值选择Gaussian likelihood,对正的计数值选择negative-binomial likelihood。

优化目标是最大化log-likelihood:
L=∑i=1N∑t=t0Tlog⁡l(zi,t∣θ(hi,t))\mathcal L = \sum_{i=1}^N \sum_{t=t_0}^T \log l(z_{i,t} | \theta(\mathbf h_{i,t})) L=i=1Nt=t0Tlogl(zi,tθ(hi,t))因为模型没有隐变量,所以不需要inference,可以直接用梯度下降优化。需要优化的参数Θ\ThetaΘ包含RNN的参数,和计算分布参数的参数。

http://www.lryc.cn/news/38572.html

相关文章:

  • 01.Java的安装
  • 【C语言深度剖析】关键字(全)
  • English Learning - L2 语音作业打卡 双元音 [aʊ] [əʊ] Day15 2023.3.7 周二
  • 记第一次面试的过程(C++)
  • 06 电力电子仿真 MATLAB/Simulink
  • 搞懂面向对象这五大概念,才算真正跨过初学者到开发者的“分水岭“
  • 基于DelayQueue实现的延时队列
  • MATLAB实现层次分析法AHP及案例分析
  • Vue 3.0 TypeScript支持
  • STM8S系列基于IAR标准外设printf输出demo
  • PMP项目管理项目质量管理
  • 前缀和总结
  • 0109二分图-无向图-数据结构和算法(Java)
  • 计算机网络题库---选择题刷题训练(100多道精品)
  • 16、字符串生成器
  • docker基本命令-容器
  • QT入门基础(一)
  • WattOS:一个稳又快的轻量级 Linux 发行版
  • Java调用Python脚本:轻松实现两种语言的互操作性
  • 未系安全带识别系统 yolo
  • (七十六)大白话MySQL是如何根据成本优化选择执行计划的?(上)
  • DSRC技术
  • _面经问题_
  • 刷题记录(2023.3.6 - 2023.3.11)
  • 14 Day:同步锁与操作系统输入输出
  • Gradle 的下载安装教程
  • 「Python 基础」常用模块
  • Java【二叉搜索树和哈希表】详细图解 / 模拟实现 + 【Map和Set】常用方法介绍
  • 如何用 C 语言实现文本特征提取?
  • ESD静电保护器件分类简介及场景应用