当前位置: 首页 > news >正文

【小白学机器学习16】 概率论的世界观2: 从正态分布去认识世界

目录

1 从正态分布说起 

1.1 正态分布的定义

1.2 正态分布的名字

1.3 正态分布的广泛,和基础性

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

3.2 第2层次:抽样的误差,服从正态分布

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

4 正态分布的特点

4.1 正态分布是客观的

4.2 万物不齐(从结果上看)

4.3 公平只是过程上的公平,而不能保证结果上的公平

4.4 钟形曲线,无限延申和逼近

4.5 中庸

4.6 动态平衡

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

4.7.2 使用规律


正态分布,概率论都是一种世界观

1 从正态分布说起 

1.1 正态分布的定义

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

1.2 正态分布的名字

  • 正态分布 :Normal distribution
  • 自然分布
  • 常态分布
  • 高斯分布

1.3 正态分布的广泛,和基础性

  • 正态分布,在自然界广泛存在
  • 无论是宏观的世界,还是很多微观的研究
  • 因此,正态分布也称为了大家心里对概率估计的一个基础。
  • 比如
  1. 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
  2. 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

  • 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

  • 比如某个属性,
  • 按照样本的数据,横轴全部展开,为数值/数值区间
  • 根据不同的数值/数值区间,统计其频度,作为Y坐标
  • 可以看到,这个属性的频度图,就符合正态分布的曲线形状

3.2 第2层次:抽样的误差,服从正态分布

  • 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
  • 连续抽样50次,
  • 横轴是这50次的平均值
  • 纵轴是这些平均值的频度/出现次数
  • 也是符合正态分布的

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

  • 标准正态分布曲线
  • 在 -1标准差,+1标准差内,发生的概率是68%
  • 在 -2标准差,+2标准差内,发生的概率是95%
  • 在 -3标准差,+3标准差内,发生的概率是99%

4 正态分布的特点

4.1 正态分布是客观的

  • 世界是客观的,是不以人们的意志想法为转移的
  • 大地与山川,喷泉也是一个钟形曲线
  • 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。

4.2 万物不齐(从结果上看)

  • 万物不齐
  • 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
  • 喷泉也是一个钟形曲线
  • 因为万物不齐,所以需要单独的去认识每个事物。
  • 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
  • 庄子:理想? 希望万物齐一
  • 孟子:事实求是,认为万物不齐。
  • 万物不齐天地事,大道之行是中庸。

4.3 公平只是过程上的公平,而不能保证结果上的公平

  • 结果的正确/正义无法保证
  • 只能从过程的正确/正义上去保证
  • 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的

4.4 钟形曲线,无限延申和逼近

  • 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
  • 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
  • 中间的比例是最高的,这个是基于正态分布来说
  • 越到两边,占比越少,只至长尾

4.5 中庸

  • 中间的比例是最高的,这个是基于正态分布来说
  • 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
  • 越道两边,占比越少,只至长尾
  • 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
  • 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!

4.6 动态平衡

  • 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
  • 逆水行舟,不进则退。

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

  • 天之道,损有余而补不足
  • 人之道,损不足而补有余
  • 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
  • 人们自发的,都是按照人之道而行事的。
  • 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。

4.7.2 使用规律

  • 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的

http://www.lryc.cn/news/468472.html

相关文章:

  • Python 爬虫项目实战:爬取某云热歌榜歌曲
  • HCIP-HarmonyOS Application Developer 习题(十八)
  • 操作系统学习笔记2.3互斥
  • LLM - 使用 Neo4j 可视化 GraphRAG 构建的 知识图谱(KG) 教程
  • Linux 环境的搭建方式->远程登录->免密登录
  • react18中的计算属性及useMemo的性能优化技巧
  • Python 实现高效的 SM4 大文件加密解密实战指南20241024
  • 数据结构~红黑树
  • 【ROS GitHub使用】
  • 批量处理文件权限:解决‘/usr/bin/chmod: Argument list too long’的有效方法
  • 数据结构——树——二叉树——大小堆
  • Android Junit 单元测试 | 依赖配置和编译报错解决
  • ffmpeg视频滤镜: 裁剪-crop
  • 身份证归属地查询接口-在线身份证归属地查询-身份证归属地查询API
  • ESP32 S3 怎么开发基于ESP-RTC的音视频实时交互的应用,用语AI陪伴的领域
  • 车载测试分享:UDS诊断、ECU刷写、CAN一致性测试、网络通讯测试、CANoe使用、报文解析、问题定位分析
  • 预算不够,怎么跟KOL砍价?(内附砍价模板)
  • C#从零开始学习(GameObject实例)(unity Lab3)
  • 谷歌地图 | 与 Android 版导航 SDK 集成的最佳实践
  • 什么是 VolTE 中的 Slient Redial?它和 CSFB 什么关系?
  • docker 部署单节点的etcd以及 常用使用命令
  • 华为开放式耳机测评,南卡 、华为、Cleer开放式耳机超深度横评
  • 【Power Query】List.Select 筛选列表
  • Spring--4
  • django celery 定时任务 Crontab 计划格式
  • 动态应用程序安全测试 (DAST) 工具 Fortify WebInspect
  • 深入解析东芝TB62261FTG,步进电机驱动方案
  • Vue 常用的狗钩子函数
  • 【机器学习基础】激活函数
  • nnMamba用于糖尿病视网膜病变检测测试