当前位置: 首页 > news >正文

从0开始学统计-t分布

1.t分布是如何被发现的?

t分布最早由英国统计学家威廉·塞弗顿(William Sealy Gosset)在1908年提出。塞弗顿是爱尔兰的一名酿酒厂的统计学家,他的工作需要对小样本数据进行分析。由于当时样本量较小(通常小于30),传统的正态分布方法不适用于估计样本均值的抽样分布。

塞弗顿在研究中发现,当样本量较小时,样本均值的抽样分布不再服从正态分布,而是更广的、更平坦的分布。他进行了大量的模拟实验,并提出了一种新的分布,即t分布,以解决小样本量下的统计问题。

塞弗顿的研究成果最终在1908年发表在《生物学期刊》上,但由于他在酿酒厂工作,为了保密,他使用了笔名“学生”(Student)。因此,t分布也被称为学生t分布。

塞弗顿的工作对统计学产生了重大影响,尤其是在小样本数据的分析和参数估计方面。至今,t分布仍然被广泛应用于统计学和数据分析领域。

样本量大的时候,样本平均数的分布可以转化为标准正态分布:

在这里插入图片描述
但是当样本量较小的时候,这个比值的分布不再是标准正态分布。也就是说当样本量较小的时候,不能将正态分布转化为标准正态分布。因为小样本的标准差与总体的标准差存在差别,不能直接用小样本的标准差代替总体的标准差。

塞弗顿将小样本时的比值称为t值,服从新的正态分布,即t分布。t分布的均值还是0,但是标准差不再是1了。

在这里插入图片描述
2.什么是t分布的自由度?

在t分布中,自由度(degrees of freedom,简称df)是一个参数,用来确定t分布的形状。具体来说,自由度决定了t分布的尾部的厚度和宽度。

在t分布的概率密度函数中,自由度是一个正整数,通常表示为 ν。自由度越大,t分布的形状就越接近于标准正态分布(图中绿色线为标准正态分布),尾部就越窄;自由度越小,t分布的尾部就越厚,形状更加扁平。

在这里插入图片描述
在统计学中,自由度通常与样本量有关,但并不等于样本量。在不同的统计问题中,自由度的计算方式略有不同,但它们都与样本量和统计模型的复杂度有关。

3.t分布的界值是多少?

不同的自由度下,t分布有不同的界值,可以通过查表或者软件得到具体的界值。

在这里插入图片描述
比如双侧0.05,n=8时的界值在t分布和z分布时分别是:

在这里插入图片描述
我们上次做的估算总体降压效果的置信区间如果用t分布算,会得到一个更加准确的置信区间。

在这里插入图片描述
这里样本平均值是18mmHg,标准误是1.907。

在这里插入图片描述
因此,总体均值95%置信区间在13.496和22.504之间。

http://www.lryc.cn/news/353689.html

相关文章:

  • Git总结超全版
  • 网络安全之安全协议浅谈
  • 华为云部署前端项目发生的事
  • 需求:实现一个可以统计代码的运行时间
  • 软考高级之redis中使用zset实现延迟队列,你答对了么?
  • CS 下载安装详解
  • 前端canvas项目实战——在线图文编辑器(十):小地图MiniMap(上)
  • linux的chmod的数字太难记了,用u, g, o, a更简单!
  • 牛客热题:有效括号
  • 利用SQL语句实现多表联合查询——多表关系介绍
  • Java中IO流类的体系
  • 【调试笔记-20240521-Linux-编译 QEMU/x86_64 可运行的 OpenWrt 固件】
  • GitLab的原理及应用详解(六)
  • 【调和级数】100321. 优质数对的总数 II
  • Java SE入门及基础(54) 函数式接口
  • 轻松同步:将照片从三星手机传输到iPad的简便方法
  • MySQL查询某个字段含有字母数字的值
  • 通关!游戏设计之道Day14
  • 实现一个自定义 hook,用于强制刷新当前组件
  • 牛客热题:滑动窗口的最大值
  • Adobe产品安装目录修改
  • 时间(空间)复杂度(结构篇)
  • react记录部署
  • 【计算机毕业设计】基于SSM+Vue的校园美食交流系统【源码+lw+部署文档】
  • 「YashanDB迁移体验官」Mysql生产环境迁移至YashanDB数据库深度体验
  • qmt量化交易策略小白学习笔记第4期【qmt如何获取获取行情数据--内置python使用方法】
  • XXE(XML外部实体注入)
  • kafka 案例
  • 别被“涨价“带跑,性价比才是消费真理
  • GEE深度学习——使用Tensorflow进行神经网络DNN土地分类