当前位置: 首页 > news >正文

【数据分析】统计量

1. 均值、众数描述数据的集中趋势度量,四分位差、极差描述数据的离散程度。

2. 标准差、四分位差、异众比率度量离散程度,协方差是度量相关性。

 期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为:

从直观上来看,协方差表示的是两个变量总体误差的期望。

如果XY是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。

但是,反过来并不成立。即如果XY的协方差为0,二者并不一定是统计独立的。

3. 卡方检验可以分析分类变量之间的相关性。http://t.csdn.cn/SZSy6

4. t检验:t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 只能分析数值型变量。

5. 皮尔逊相关系数是一种衡量变量之间线性关系强弱的统计量。它的取值范围在-1到1之间,可以反映出两个变量之间的相关程度。如果相关系数接近1,表明两个变量之间存在完全正向的线性关系;如果接近-1,则说明存在完全负向的线性关系;如果接近0,则表示两个变量之间没有线性关系。

皮尔逊相关系数的计算方法如下:

r = Cov(X, Y) / (σX * σY)

其中,Cov(X, Y)表示变量X和Y的协方差,σX和σY分别表示变量X和Y的标准差。通过计算协方差和标准差,我们可以得到两个变量之间的相关系数。

只能分析数值型变量。

例子:百度安全验证

 6. 列联相关:列联相关又称列联相关系数(contingencycorrelation)又称均方相依系数或接触系数,是指当两列数据中至少有一列是多分类资料时,描述变量之间的相互关系的品质相关系数。

可以分析分类变量之间的相关性

7. SQL中的关键字:float浮点型、int 整数型、char 文本型、decimal 定点型

8.  HAVING 子句中的筛选字段必须是可以出现在分组结果中的字段

9. 多维数据库——雪花模式

雪花模式是集中代表事实表的连接到多个层面 ,是类似星型模式 。

星型模型:星型模式是多维的数据关系,它由事实表(Fact Table)和维表(Dimension Table)组成。每个维表中都会有一个维作为主键,所有这些维的主键结合成事实表的主键。事实表的非主键属性称为事实,它们一般都是数值或其他可以进行计算的数据。

 

交叉模型:

 

 

http://www.lryc.cn/news/144309.html

相关文章:

  • 【通用消息通知服务】0x4 - 目前进展 阶段复盘
  • vue若依导出word文件,简单的实现
  • 【LeetCode75】第四十题 最大层内元素和
  • 脱离束缚:数字化工厂中ARM控制器的革命性应用!
  • queue ide is not exists in YARN
  • 【C++】UDP通信:客户端向服务端发送消息并接收服务端回应的消息
  • RabbitMq深度学习
  • EasyExcel自定义字段对象转换器支持转换实体和集合实体
  • Linux重置ROOT密码(CentOS)
  • 【Spring】一文带你彻底搞懂IOC、AOP
  • 国际旅游网络的大数据分析(数学建模练习题)
  • 音视频技术开发周刊 | 308
  • 多旋翼飞控底层算法开发系列实验 | 多旋翼动力系统设计实验3
  • Redis之Sentinel(哨兵)机制
  • 加密的PDF文件,如何解密?
  • 【java】获取当前年份
  • 前端面试话术集锦第一篇
  • NeRFMeshing - 精确提取NeRF中的3D网格
  • 后端面试话术集锦第五篇:rabbitmq面试话术
  • Spring Boot(Vue3+ElementPlus+Axios+MyBatisPlus+Spring Boot 前后端分离)【一】
  • vue3之reactive和ref学习篇
  • 【推荐】Spring与Mybatis集成整合
  • listdir, makedirs, shuffle, exists, webdriver.Chrome, roll方法快速查阅
  • java.nio.ByteBuffer 学习笔记
  • 自动化实时在线静电监控系统的构成
  • Windows 转 mac 记录
  • Linux_4_文本处理工具和正则表达式
  • [Unity]VSCode无代码提示
  • 画流程图都可以用哪些工具?
  • Elasticsearch中倒排索引、分词器、DSL语法使用介绍