当前位置: 首页 > news >正文

假设检验的基本思想

假设检验

首先了解参数估计,比如有服从正态分布的数据集X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})XN(μ,σ2),我们希望根据样本x1,...xnx_{1},...x_{n}x1,...xn估计出参数μ,σ\mu,\sigmaμ,σ,这些参数可以是一个具体值,也可以是一个范围(即一个区间)。

对于假设检验,分为两种情况:

  • 参数假设检验:这种情况下,我们知道总体分布,比如我们已知数据集服从正态分布X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})XN(μ,σ2),但参数μ,σ\mu,\sigmaμ,σ我们是不知道的,我们假设μ=μ0,σ=σ0\mu=\mu_{0},\sigma=\sigma_{0}μ=μ0,σ=σ0,现在,我们依然根据样本x1,...xnx_{1},...x_{n}x1,...xn去判断μ\muμ是否等于μ0\mu_{0}μ0,即根据样本判断假设是否成立。
  • 非参数假设检验:这是对于分布未知的情况。

总之,假设检验的目的是根据样本判断假设是否成立。

通常存在两种假设,以前面参数假设检验为例:

  • 原假设H0H_{0}H0:假设μ=μ0\mu=\mu_{0}μ=μ0;原假设的概率通常较大;
  • 备择假设H1H_{1}H1:假设μ≠μ0\mu\neq\mu_{0}μ=μ0

如果根据样本检验后发现,原假设不成立,备择假设成立,则称[x1,...,xn]∈K0[x_{1},...,x_{n}]\in K_{0}[x1,...,xn]K0,样本属于拒绝域K0K_{0}K0。换言之,如果原假设不成立,我们应拒绝原假设。

在拒绝域中的样本才能判断出假设不成立,如果样本不在拒绝域中,我们才能接受原假设。

我们根据样本判断假设,但存在局限性,因为样本数量有限,样本数量多只能降低检验出错的概率,不能代表检验结果完全正确。因此假设检验应考虑到两种错误:

  • 原假设成立,但检验后却拒绝了原假设,即弃真错误;
    我们把概率P{拒绝H0∣H0成立}=αP\left\{拒绝H_{0}|H_{0}成立\right\}=\alphaP{拒绝H0H0成立}=αα\alphaα称为显著性水平,通常,α\alphaα的值是很小的。如果样本落在拒绝域内的概率P{[x1,...,xn]∈K0}≤αP\left\{[x_{1},...,x_{n}]\in K_{0}\right\}\leq\alphaP{[x1,...,xn]K0}α,我们就接受原假设,因为此时检验出错的概率已经很低。
    反过来,如果P{[x1,...,xn]∈K0}>αP\left\{[x_{1},...,x_{n}]\in K_{0}\right\}>\alphaP{[x1,...,xn]K0}>α,我们应当拒绝原假设。
  • 原假设不成立,但检验后接受了原假设,即取伪错误;

p-value

p值是假设检验中,判断是否要拒绝原假设的指标,p值是一个概率。

p值:原假设正确时,样本观测值取得某一结果(以及比这个结果更极端结果)的概率

举例:判断硬币是否公平(出现正面的概率为50%)

原假设:抛硬币结果为正面的概率为50%;
备择假设:抛硬币结果为正面的概率不为50%;

样本,抛硬币500次,正面出现次数10次,反面出现490次。

对于抛硬币500次,整体应服从二项分布:
fig1

因此,在原假设正确时,预期应该是250次正面,然而实际情况是10次正面,比该结果更极端的情况是正面次数为0次-9次。

另外,如果正面出现超过490次也属于极端情况,因此,图中红色区域表示当前结果以及极端结果。

p值就是图中红色区域对应的概率(面积)。如果p值很小,则意味着,在原假设正确的情况下,小概率事件发生了,比如p值只有1%,即我们只有1%的概率得到目前的观测结果,既然小概率事件发生,我们就有更大概率怀疑这个原假设,因此我们可以拒绝原假设。

通常,只要p值小于显著性水平α\alphaα,我们就拒绝原假设。

http://www.lryc.cn/news/17811.html

相关文章:

  • c语言机试练习
  • Python的PyQt框架的使用-资源文件夹的使用
  • 如何遍历HashMap
  • 11技术太卷我学APEX-数据加载
  • JVM记录
  • 盘点机器学习实战中最频繁使用的AutoML工具库
  • 50-Jenkins-Lockable Resources插件实现资源锁定
  • 测试员,如果未来5年你不想失业……你得学会自动化测试
  • 腾讯开源的 hel 提供了加载远程模块的能力,谈谈它的实现原理
  • 【运动控制】CNC三轴小线段路径规划
  • 渗透测试之DNS域名信息探测实验
  • ASE140N04-ASEMI低压MOS管ASE140N04
  • Qt——QLineEdit
  • 前端-HTML-zxst
  • 终极方案,清理 docker 占用磁盘过大问题, 亲测有效!
  • puzzle(1321)时间旅人
  • 活动预告 | 2023 Meet TVM 开年首聚,上海我们来啦!
  • CoreIDRAW 软件的强大功能及适用性
  • JavaScript Window History
  • 2023年人力资源管理师报名和培训费用是多少
  • 2023-2-23 刷题情况
  • 数据归档,存储的完美储备军
  • ES6-11、基本全部语法
  • Spring Boot整合Thymeleaf和FreeMarker模板
  • SQL的四种连接-左外连接、右外连接、内连接、全连接
  • “点工”的觉悟,5年时间从7K到24K的转变,我的测试道路历程~
  • 【Web安全-MSF记录篇章一】
  • 配置Flutter开发环境
  • 23年六级缓考
  • 低代码选型,论协同开发的重要性