当前位置: 首页 > news >正文

Stochastic Approximation 随机近似方法的详解之(一)

随机近似的定义:它指的是一大类随机迭代算法,用于求根或者优化问题。

Stochastic approximation refers to a broad class of stochastic iterative algorithms solving root finding or optimization problems.

temporal-difference algorithms是随机近似算法的一个特殊情景。

启发例子:均值估计

假设有限集合为X\mathcal{X}X,考虑随机变量XXX 是定义在这个集合的随机变量。我们的目的是估测 E[X]\mathbb{E}[X]E[X],我们是从样本中抽样的方法用样本均值x‾\overline{x}x 近似这个期望的值。x‾\overline{x}x 怎么来算呢?
抽取所有样本然后求均值的方法对于样本量巨大的情况显得很慢。
我们可以考虑用增量迭代(incremental and iterative)的方法:

先说结论,对一个新来的抽样样本,我们可以用这样的方法更新均值:

在这里插入图片描述

证明如下:

wk+1=1k∑i=1kxi=1k(∑i=1k−1xi+xk)=1k((k−1)wk+xk)=wk−1k(wk−xk)w_{k+1}=\frac{1}{k} \sum_{i=1}^k x_i=\frac{1}{k}\left(\sum_{i=1}^{k-1} x_i+x_k\right)=\frac{1}{k}\left((k-1) w_k+x_k\right)=w_k-\frac{1}{k}\left(w_k-x_k\right)wk+1=k1i=1kxi=k1(i=1k1xi+xk)=k1((k1)wk+xk)=wkk1(wkxk)

整个过程数学展开如下:
在这里插入图片描述
相比全部抽样完了再计算均值,这个方法的好处在于每到达一个样本就可以实时的更新均值,使用部分样本计算出来的样本均值可以立马使用。随着抽样的进行,均值的计算结果会越来越精确。

重点!!而上面的均值迭代更新公式可以更一般地表示为:在这里插入图片描述
当这个系数αk\alpha_kαk满足一些条件的时候,这个更新公式是会收敛到 E[X]\mathbb{E}[X]E[X] 的。

至此,我们已经见识了(6-2)和(6-4)两种随机迭代算法。

http://www.lryc.cn/news/25774.html

相关文章:

  • 软件自动化测试工程师面试题集锦
  • 智合同丨教你做一个懂AI的法律人
  • 如何判断自己使用的IP是独享还是共享?
  • 跳石头
  • 上传gitee教程,Gitee怎么上传代码到仓库
  • netstat命令详解
  • 数据库三范式
  • K8S 1.20 弃用 Docker 评估之 Docker 和 OCI 镜像格式的差别
  • Vue2和Vue3响应式的区别
  • 模型实战(6)之Alex实现图像分类:模型原理+训练+预测(详细教程!)
  • 【大数据】最全的大数据Hadoop|Yarn|Spark|Flink|Hive技术书籍分享/下载链接,持续更新中...
  • RIG Exploit Kit 仍然通过 IE 感染企业用户
  • GIS在地质灾害危险性评估与灾后重建中的实践技术应用及python机器学习灾害易发性评价模型建立与优化进阶
  • SQL SERVER中SCHEMA的詳解
  • 【LeetCode】剑指 Offer(13)
  • 帮助小型企业实现业务增长的7种数字营销策略
  • 互联网行业的高级产品经理和普通产品经理有哪些区别?
  • aardio - 【库】简单信息框
  • 程序员必备!最值得收藏的宝藏网站大盘点
  • Android 10.0 Settings 关掉开发者模式
  • 软件测试面试必杀篇:【2023软件测试面试八股文宝典】
  • 原子级操作快速自制modbus协议
  • 大数据之Apache Doris_亚秒级响应_大数据处理分析_介绍_概述---大数据之Apache Doris工作笔记0001
  • SpringCloud学习笔记 - 分布式系统全局事务管理 - Seata1.5.2+Nacos+OpenFeign
  • LeetCode190_190. 颠倒二进制位
  • atomic 原子操作
  • DataGear 制作基于Vue前端框架渲染的数据可视化看板
  • JavaFX Scene Builder 下载安装
  • dva( 轻量级的应用框架 )
  • 数据结构:堆的实现与建堆时间复杂度分析