当前位置: 首页 > news >正文

概率论:样本与总体分布,Z分数与概率

参考书目:《行为科学统计精要》(第八版)——弗雷德里克·J·格雷维特

数据及其样本的分布

描述一组数据分布

 

描述一组样本数据的分布

描述样本数据的均值和整体数据一样,但是样本标准差的公式除以了n-1,这里引入自由度的概念

自由度:如果均值确定,那么n个数据组成的样本中,只有n-1个数据的取值是自由的,最后一个数据等于n*均值减去其余n-1个值的和

Z分位数 

Z分位数描述的是一个数据在整组数据中的位置:即:当前值x距离总体均值有多少个标准差的距离

 

Z分位数因为是描述分布位置的,所以我们通常在去量纲单位(标准化为0-1的分布)的处理中经常用到,因为不管数据单位是时分秒,十万百万千万,在观测某个数值在整体分布中的位置,衡量标准都是一样的,不受单位影响。

 

Z分位数可以帮助判断一个样本是不是异常值,也就是根据一个数据在整组数据中的Z分位数值,对应找到这个数据在整组数据中出现的概率,具体数值参考标准正态分布表,如下图

 也就是说,如果Z分位数大于1.96,那么数据出现的概率小于1-97.5%=2.5%,对应的因为是标准正态分布,所以Z分位数小于1.96,对应数据出现的概率也是同样小于2.5%

总体和样本

如果Z分位数衡量的是,一个数值在整体数值中出现的概率大小。换句话说Z分位数可以表示,这个数值是能代表整体的,还是说是个异常值

那么,按照这个思路,我们如何衡量在一个整体中随机挑选N个数值组成的样本是否能代表整体

我们直观感受,影响这个结论的因素有三点:

1、样本均值和总体均值是否相近(M-μ),越相近说明越能代表总体

2、总体分布方差,总体数据的离散度越小选中的样本越有代表性,极端情况总体数据都是一样的值,那么无论怎么选,样本分布都和总体分布一致

3、样本量大小(n),样本量越大越能体现整体,极端情况样本量最大等于整体数据量

将以上三个因素结合Z分位数的计算思路,我们引出样本Z分位数

 

如果Z分位数过大或者过小,那么说明不大可能从总体中抽中这样的样本。

http://www.lryc.cn/news/90067.html

相关文章:

  • 【JavaSE】Java基础语法(十二):ArrayList
  • c++—封装:运算符重载、友元
  • 【K8s】安全认证与DashBoard
  • SpringMVC第七阶段:SpringMVC的增删改查(01)
  • 接口测试-Mock测试方法
  • 关于宝塔部署jar包和war包
  • SpringMVC框架面试专题(初级-中级)-第十节
  • PCIe TLB事务层详解过程
  • RK3588平台开发系列讲解(项目篇)YOLOv5部署测试
  • 基于变形模板的弱监督体图像分割
  • python实现单例模式及其应用
  • SSM 如何使用 Seata 框架实现分布式事务?
  • FreeRTOS任务相关API函数
  • VBA之正则表达式(42)-- 提取代码中变量名称
  • Unity Lightmapping Setting
  • Android 12.0Camera2 静音时拍照去掉快门声音
  • Win11硬盘分区
  • 访客管理系统:Lobby Track Crack
  • Lidar AI Solution环境配置
  • 子串--子字符串 0528
  • 大数据教程【01.04】--excel的使用
  • Java输入输出流
  • 1688商品ID采集一件代发详情页面数据
  • 丽江“美丽县城”建设,高精度地籍免像控案例分享
  • 我是如何精通软件工程的
  • 如何使用 Python Nornir 实现基于 CLI 的网络自动化?
  • 并发编程的三大特性之有序性
  • LeetCode:相交链表(java)
  • 利用PHP导出MySQL数据表结构和SQL文件
  • 接口测试框架分析