当前位置: 首页 > news >正文

模式识别 —— 第二章 参数估计

模式识别 —— 第二章 参数估计

文章目录

  • 模式识别 —— 第二章 参数估计
    • 最大似然估计(MLE)
    • 最大后验概率估计(MAP)
    • 贝叶斯估计

最大似然估计(MLE)

在语言上:

  • 似然(likelihood)和**概率(probability)**是同义词,都指事件发生的可能性。

但是在统计中:

  • 概率是已知参数,对结果可能性的预测。
  • 似然是已知结果,对参数是某个值的可能性预测。

可见这两个过程正好是相反的。

因此最大似然估计是已知数据来求概率最大的参数。

以抛硬币为例,假设我们有一枚硬币,现在要估计其正面朝上的概率θ\thetaθ。我们进行了10次实验其中正面朝上的次数为6次,反面朝上的次数为4次。

对一个独立同分布的样本集来说,总体的似然就是每个样本似然的乘积。针对抛硬币的问题,似然函数可写作:
在这里插入图片描述
似然函数图如下:
在这里插入图片描述

由于总体的似然就是每个样本似然的乘积,为了求解方便,我们通常会将似然函数转成对数似然函数,然后再求解。可以转成对数似然函数的主要原因是对数函数并不影响函数的凹凸性。因此上式可变为:

在这里插入图片描述
对该式子求导等于0即可解出当θ^=0.6\hat{\theta} = 0.6θ^=0.6时,是最优参数。

正态分布的最大似然估计

假设样本服从正态分布NNN~(μ,σ2)(\mu,\sigma^2)(μ,σ2),则其似然函数为:
在这里插入图片描述

对其取对数得:

在这里插入图片描述分别对μ,σ2\mu , \sigma^2μ,σ2求偏导,并令偏导数为0,得:
在这里插入图片描述

解得:
在这里插入图片描述

最大似然估计的求解步骤:\red{最大似然估计的求解步骤:}最大似然估计的求解步骤:

  • 确定似然函数
  • 将似然函数转化为对数似然函数
  • 求对数似然函数的最大值(求导,解似然方程)

最大后验概率估计(MAP)

最大似然估计认为使似然函数P(X∣θ)P(X\mid \theta)P(Xθ)最大的θ\thetaθ就是最好的参数θ\thetaθ。此时最大似然估计是将θ\thetaθ看作固定的值,只是其值未知。

最大后验概率认为θ\thetaθ是一个随机变量θ\thetaθ,即具有某种概率分布,称为先验分布,求解时除了要考虑似然函数P(X∣θ)P(X\mid \theta)P(Xθ)之外还要考虑θ\thetaθ的先验分布P(θ)P( \theta)P(θ)。其认为P(X∣θ)P(θ)P(X\mid \theta)P( \theta)P(Xθ)P(θ)取最大时的θ\thetaθ才是最优参数。

由于XXX的先验分布P(X)P( X)P(X)是固定的,所以其不影响对参数θ\thetaθ的判断。因此最大后验概率估计的公式表示为:

在这里插入图片描述在抛硬币的例子中,通常认为当θ=0.5\theta = 0.5θ=0.5时可能性最大。因此我们用均值为0.5,方差为0.1的高斯分布来描述θ\thetaθ的先验概率分布。其表达式如下:

在这里插入图片描述
先验分布的函数如图:
在这里插入图片描述
因此,先验与似然的乘积如下:
在这里插入图片描述为了方便求导,我们将其转化为对数函数:
在这里插入图片描述
让上式为0化简得:
在这里插入图片描述

解得,θ^≈0.529\hat{\theta} \approx 0.529θ^0.529

相比最大似然估计的θ^=0.6\hat{\theta} = 0.6θ^=0.6,可见在最大后验概率估计中θ\thetaθ的估计值与θ\thetaθ的先验分布有的很大的关系。

最大后验概率估计的求解步骤:\red{最大后验概率估计的求解步骤:}最大后验概率估计的求解步骤:

  • 确定参数的先验分布以及似然函数
  • 将其乘积转换为对数形式
  • 求对数函数的最大值(求导,解方程)

贝叶斯估计

http://www.lryc.cn/news/32079.html

相关文章:

  • 判断4位回文数-课后程序(Python程序开发案例教程-黑马程序员编著-第3章-课后作业)
  • 【NLP】Word2Vec 介绍
  • 3月6日,30秒知全网,精选7个热点
  • Python笔记 -- 字典
  • 【独家】华为OD机试 - 滑动窗口(C 语言解题)
  • MySQL调优 - SQL查询深度分页问题
  • 0306spring--复习
  • 动手实现一遍Transformer
  • 【Flutter入门到进阶】Flutter基础篇---弹窗Dialog
  • 【操作系统】进程和线程的区别
  • Linux开发环境配置--正点原子阿尔法开发板
  • Android ThreadPoolExecutor的基本使用
  • 基于区域生长和形态学处理的图像融合方法——Matlab图像处理
  • 三个案例场景带你掌握Cisco交换机VLAN互通
  • 小白入门之持久连接与非持久连接的差别
  • TypeScript篇.01-简介,类,接口,基础类型
  • 分享几种WordPress怎么实现相关文章功能
  • PANGO的IOB的电平能力那些事
  • scrpy学习-02
  • MySQL运维篇之Mycat分片规则
  • vue router elementui template CDN模式实现多个页面跳转
  • ElasticSearch - ElasticSearch基本概念及集群内部原理
  • 【反射中,Class.forName和ClassLoader区别】
  • 2023了为什么还有人在问:女生适合做跨境电商吗?
  • 磁盘分区和挂载
  • 电子技术——晶体管尺寸
  • Tuxera NTFS2023MacOS读写软件功能介绍使用
  • 2022年数维杯国际大学生数学建模挑战赛A题自动地震地平线跟踪解题全过程论文及程序
  • 推荐系统[八]:推荐系统常遇到问题和解决方案[物品冷启动问题、多目标平衡问题、数据实时性问题等]
  • shutil.copyfile PermissionError: [Errno 13] Permission denied