当前位置: 首页 > news >正文

矩估计与最大似然估计的通俗理解

点估计与区间估计

矩估计与最大似然估计都属于点估计,也就是估计出来的结果是一个具体的值。对比区间估计,通过样本得出的估计值是一个范围区间。例如估计馒头店每天卖出的馒头个数,点估计就是最终直接估计每天卖出10个,而区间估计是最终估计的结果是每天卖出7到12个。

矩估计

矩估计就是直接用样本替代总体,所以样本均值 x ‾ \overline{x} x等于总体均值 E ( x ) E(x) E(x),样本平方的均值 x 2 ‾ \overline{x^2} x2等于总体均值 E ( x 2 ) E(x^2) E(x2)
例如要估计馒头店每天卖出的馒头个数,我们可以记录30天卖出的馒头数量并除以30平均得到一天卖出的馒头数量并作为估计结果。所以矩估计非常简单易懂,但是受到取样和异常值的影响也比较大。

利用数学语言描述如下:
A k A_{k} Ak x x x k k k阶原点矩。
A k = 1 n ∑ i = 1 n x i k A_{k} = \dfrac{1}{n}\sum_{i=1}^{n}x_{i}^{k} Ak=n1i=1nxik

期望估计(一阶原点矩)
A 1 = E ( x ) = x ‾ A_{1} = E(x) = \overline{x} A1=E(x)=x

方差估计(二阶原点距)
A 2 = E ( x 2 ) = D ( x ) + [ E ( x ) ] 2 A_{2} = E(x^{2}) = D(x) + \left[E(x)\right]^{2} A2=E(x2)=D(x)+[E(x)]2
在实际应用中可以通过样本算出样本的一阶矩和二阶矩,从而得到方差的估计值
D ( x ) = x 2 ‾ − ( x ‾ ) 2 D(x)=\overline{x^2}-(\overline{x})^2 D(x)=x2(x)2

最大似然估计

最大似然估计认为我们既然已经抽取得到了样本结果,那么就认为这个样本结果就是所有情况、所有样本结果中出现概率最大的那一个。考虑到这个样本中每次的取样都是独立同分布的,所以将每一个取值对应的概率相乘就是这一个样本结果出现的概率(也就是似然函数),那么只要让这一个结果出现的概率(似然函数)最大就可以估算出每个值对应的概率
例如要估计馒头店每天卖出的馒头个数是否大于5,最大似然估计就是抽出10天卖出的馒头数,假设现在抽出的结果中有7天是卖出超过了5个馒头,有3天是卖出了少于5馒头,那么直觉告诉我们馒头店每天卖出的馒头个数大于5的概率很大可能为0.7,这样才最可能出现我们现在得到的抽样结果。

所以最大似然估计的一般步骤为:

  1. 写出似然函数(也就是样本结果出现的概率)。对于离散型变量是将对应概率相乘,连续型变量就是概率密度函数相乘。分别有:
    离散型:
    L ( θ ) = ∏ i = 1 n P θ ( X i = x i ) L(\theta)=\prod \limits_{i=1}^n P_\theta(X_i=x_i) L(θ)=i=1nPθ(Xi=xi)
    连续型:
    L ( θ ) = ∏ i = 1 n f ( x i ) L(\theta)=\prod \limits_{i=1}^n f(x_i) L(θ)=i=1nf(xi)
  2. 求似然函数最大时的 θ \theta θ的值。一般为了简化计算,首先对等式两边取对数,将相乘改为相加减,然后对 θ \theta θ求导,求得导数为0时 θ ^ \hat \theta θ^的取值即为最大似然估计值

最大似然估计(MLE)是用来解决“模型已定,参数未知”的问题,在一元线性回归,逻辑回归等众多模型中都会涉及到

实际应用

假设总体 X X X的概率分布为
在这里插入图片描述
其中 θ ( 0 < θ < 1 2 ) \theta(0<\theta<\frac{1}{2}) θ0<θ<21是未知参数,利用总体 X X X的如下样本值1,2,1,0,1,0,1,2,1,2,求 θ \theta θ的矩估计与最大似然估计值。

矩估计:
E ( X ) = ( θ 2 ) × 0 + 2 θ ( 1 − θ ) × 1 + ( 1 − θ ) 2 × 2 = 2 − 2 θ E(X)=(\theta^2) \times 0+2\theta(1-\theta) \times 1 +(1-\theta)^2 \times 2=2-2\theta E(X)=(θ2)×0+2θ(1θ)×1+(1θ)2×2=22θ
样本均值 X ‾ = 11 10 样本均值 \overline X=\frac{11}{10} 样本均值X=1011
根据 E ( X ) = X ‾ E(X)=\overline X E(X)=X可解得 θ ^ = 9 20 \hat \theta=\frac{9}{20} θ^=209

最大似然估计:
设似然函数为 L ( θ ) L(\theta) L(θ),根据样本有2个0值,5个1值,3个2,则有:
L ( θ ) = ( θ 2 ) 2 [ 2 θ ( 1 − θ ) ] 5 ( 1 − θ ) 6 = 2 5 θ 9 ( 1 − θ ) 11 L(\theta)=(\theta^2)^2[2\theta(1-\theta)]^5(1-\theta)^6=2^5\theta^9(1-\theta)^{11} L(θ)=(θ2)2[2θ(1θ)]5(1θ)6=25θ9(1θ)11
对式子两边取对数,有:
l n L ( θ ) = 5 l n 2 + 9 l n θ + 11 l n ( 1 − θ ) ln L(\theta)=5ln2+9ln\theta+11ln(1-\theta) lnL(θ)=5ln2+9lnθ+11ln(1θ)
θ \theta θ求导并令导数为0,有:
d [ l n L ( θ ) ] d θ = 9 θ − 11 ( 1 − θ ) = 0 \frac{d[lnL(\theta)]}{d\theta}=\frac{9}{\theta}-\frac{11}{(1-\theta)}=0 dθd[lnL(θ)]=θ9(1θ)11=0
θ ^ = 9 20 \hat \theta=\frac{9}{20} θ^=209

在本例中,矩估计和最大似然估计的值求出来时一致的,有的情况下两种办法求出来的估计值并不一致

http://www.lryc.cn/news/411233.html

相关文章:

  • 性能调优本质:如何精准定位瓶颈并实现系统极致优化
  • Git的命令
  • WPF中使用定时器更新元素-DispatcherTimer
  • 计算机网络 - 理解HTTP与HTTPS协议的关键区别与安全性
  • 【Spring Framework】使用XML配置文件配置Bean的实例化方式
  • 模拟电子技术-实验四 二极管电路仿真
  • Git 子仓(Git Submodule)学习
  • JavaSE基础 (认识String类)
  • 学习大数据DAY25 Shell脚本的书写2与Shell工具的使用
  • Java学习Day19:基础篇9
  • 如何撤销git add ,git commit 的提交记录
  • Postman环境变量的高级应用:复杂条件逻辑的实现
  • AI问答-供应链管理:理解医疗耗材供应链SPD板块
  • 科普文:分布式数据一致性协议Paxos
  • Vue3 + js-echarts 实现前端大屏可视化
  • 知乎信息流广告怎么投?一文读懂知乎广告开户及投放!
  • TikTok达人合作:AI与大数据如何提升跨境电商营销效果
  • win11管理员账户为啥不能改?win11怎么更改管理员账户名称?
  • Spring Security学习笔记(三)Spring Security+JWT认证授权流程代码实例
  • 精装房、旧房改造智能家居,单火线也有“救”了单火模块 零线发生器
  • 使用URLSearchParams获取url地址后面的参数(window.location.href)
  • 计算机网络03
  • linux每个目录都是干啥的???linux目录说明
  • DB2-Db2StreamingChangeEventSource
  • 在当前的数字化时代,Cobol 语言如何与新兴技术(如云计算、大数据、人工智能)进行融合和交互?
  • 使用SDL库以及C++实现的简单的贪吃蛇:AI Fitten生成
  • 【C++标准库】模拟实现string类
  • ArcGIS for js 标记(vue代码)
  • 全网最全最新100道C++面试题:40-60
  • RAG+内容推荐,应该如何实践?