当前位置: 首页 > news >正文

【小白学机器学习42】进行多次抽样,样本的分布参数和总体的分布参数的关系

目录

1 进行多次抽样,样本的分布参数和总体的分布参数的关系

2  样本容量越大,多次抽样的样本的分布参数和总体的分布参数的关系

3 随着样本容量增大,多次抽样均值的 平均值,方差的变化

4 随着样本容量增大,多次抽样方差的 平均值,方差的变化


进行多次抽样,样本的分布参数和总体的分布参数的关系

1 进行多次抽样,样本的分布参数和总体的分布参数的关系

  • 每次抽样都会得到1个均值,1个方差
  • 多次抽样会得到多个均值,多个方差
  • 可以把多次抽样得到的均值,方差再进行平均,看下多次抽样的平均值和总体参数的关系

  • 多次抽样会得到多个均值→也就是均值数组,这个均值数组的平均值,接近总体的均值
  • 多次抽样会得到多个方差→也就是方差数组,这个方差数组的平均值,会远小于总体的均值,这就是样本方差对总体方差的有偏估计。
  •  std的情况类方差。

import numpy as np
import pandas as pd
import scipy as sp
from matplotlib import pyplot as plt
import seaborn as sns
%precision 3population1=sp.stats.norm(loc=4,scale=0.8)  #不设置size,可以认为是一个无限的总体?
samples_mean_array1=np.zeros(1000)
np.random.seed(1)
for i in range(0,1000):sample1=population1.rvs(size=10)samples_mean_array1[i]=np.mean(sample1)#print(samples_mean_array1)
sns.distplot(samples_mean_array1)
#sns.histplot(samples_mean_array1)
#sns.kdeplot(samples_mean_array1, fill=True)
plt.show()print(f"设置的总体的均值 =4")
print(f"设置的总体的方差 ={0.8*0.8}")
print(f"设置的总体的标准差 =0.8")
print()print(f"多次抽样的样本均值的均值 = {np.mean(samples_mean_array1)}")
print(f"多次抽样的样本方差的均值 = {np.var(samples_mean_array1)}")
print(f"多次抽样的样本标准差的均值 = {np.std(samples_mean_array1)}")
print()print("多次抽样的样本的均值的均值,接近总体的均值")      
print("多次抽样的样本的方差的均值,远远小于总体的方差")   
print("多次抽样的样本的标准差的均值,远远小于总体的标准差")       
print()

2  样本容量越大,多次抽样的样本的分布参数和总体的分布参数的关系

  • 首先,还是基于,多次抽样
  • 因为单次抽样的随机性比较大
  • 样本容量越大,多次抽样的样本的分布参数和总体的分布参数的关系会发现
  1. 样本容量越大,多次抽样的样本的平均值的均值,会收敛,越来越接近总体的平均值
  2. 样本容量越大,多次抽样的样本的方差的均值,会收敛,越来越接近总体的方差

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数!!

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数!!

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数!!

随着抽样次数的变化

每次都增加抽样样本的容量

可以发现

写到一半,代码居然崩了,丢失了。。。。

3 随着样本容量增大,多次抽样均值的 平均值,方差的变化

  • 多次抽样的样本均值的均值 趋向总体的均值
  • 多次抽样的样本均值的 方差很小,说明很稳定

4 随着样本容量增大,多次抽样方差的 平均值,方差的变化

  • 多次抽样的样本方差的均值,应该还是小于总体的方差,因为是有偏估计
  • 多次抽样的样本方差的 方差很大?不稳定?

http://www.lryc.cn/news/493861.html

相关文章:

  • 链动星海 质引未来|中信银行加码科技金融 “接力式”服务助力“新质生产力”释放
  • 黑马2024AI+JavaWeb开发入门Day02-JS-VUE飞书作业
  • 云计算基础-期末复习
  • Java GET请求 请求参数在Body中使用Json格式传参
  • AI数据分析工具(一)
  • go结构体匿名“继承“方法冲突时继承优先顺序
  • 【049】基于51单片机语音录放【Proteus仿真+Keil程序+报告+原理图】
  • 《软件项目管理》期末-复习题及参考答案
  • milvus 通俗易懂原理
  • 什么是撞库、拖库和洗库?
  • 安卓-碎片的使用入门
  • 华为IPD流程学习之——深入解读123页华为IPD流程体系设计方法论PPT
  • DriveMLLM:一个专为自动驾驶空间理解任务设计的大规模基准数据集
  • 高效处理 iOS 应用中的大规模礼物数据:以直播项目为例(1-礼物池)
  • python的函数与递归
  • RabbitMQ学习-Seven
  • 中科亿海微SoM模组——波控处理软硬一体解决方案
  • 开源法律、政策和实践
  • 【计算视觉算法与应用】金字塔,下采样Gaussian Pyramid. 上采用 Laplacian Pyramid (code: py)
  • 基于BERT的语义分析实现
  • DNS查询工具
  • ODB 框架
  • Ubuntu WiFi检测
  • QILSTE H4-108TCG高亮纯lu光LED灯珠 发光二极管LED
  • IP与“谷子”齐飞,阅文“乘势而上”?
  • Java阶段三05
  • C# yield 关键字
  • SpringBoot开发——结合Nginx实现负载均衡
  • RabbitMQ在手动消费的模式下设置失败重新投递策略
  • TsingtaoAI具身智能高校实训方案通过华为昇腾技术认证