当前位置: 首页 > news >正文

R语言:卡方检验

        χ2检验(Chi-Square Test)是一种用于检验分类变量之间是否存在相关性的统计方法。χ2检验的原理基于观察到的频数与期望频数之间的偏差来判断分类变量之间是否存在显著的关联。
        χ2检验的原理可以概括为以下几个步骤:
        建立假设:首先,需要建立零假设(H0)和备择假设(H1)。在χ2检验中,零假设通常是假设两个分类变量之间没有关联,备择假设则是它们之间存在关联。
        计算期望频数:根据观察到的数据计算期望频数。期望频数是基于零假设下的预期频数,它告诉我们如果零假设成立,我们期望在每个组中看到多少观察值。
        计算χ2统计量:根据观察频数和期望频数计算χ2统计量。χ2统计量衡量了观察值与期望值之间的偏差程度,它的计算公式为:χ2 = Σ [(观察频数 - 期望频数)^2 / 期望频数]。
        确定显著性水平:选择显著性水平(通常为0.05),用来评估χ2统计量的显著性。
比较χ2统计量与临界值:根据自由度和显著性水平查找χ2分布表,找到临界值。将计算得到的χ2统计量与临界值进行比较。
        做出决策:如果计算得到的χ2统计量大于临界值,则拒绝零假设,认为分类变量之间存在关联;如果小于临界值,则接受零假设,认为分类变量之间没有关联。
通过以上步骤,χ2检验可以帮助我们判断分类变量之间是否存在关联,并评估这种关联的显著性。

        这个意思是根据给定的数据,对比了男性和女性病例的阳性率,并进行了χ2检验来评估两者之间的差异是否具有统计学意义。

例子:

        男性病例总数为 7,866,其中阳性病例数为 342,阳性率为 4.35%。
        女性病例总数为 6,038,其中阳性病例数为 310,阳性率为 5.13%。
进行χ2检验后得到的结果是:

χ2值为 4.726。
P值为 0.030。

        在这种情况下,通过对比两个性别的阳性率并进行χ2检验,发现两个性别之间的差异具有统计学意义。也就是说,男性和女性病例的阳性率之间的差异不太可能是由随机因素引起的,而可能存在有意义的关联或差异。

        需要注意的是,P值(显著性水平)小于0.05,这意味着我们可以以95%的置信度拒绝零假设,即男性和女性病例的阳性率之间存在显著差异。

使用R语言实现卡方检验

> table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果)阳性 阴性男 1507 1126女 1429  971

我们看到这个数据男性阳性人数为1507,阴性为1126,女性阳性为1429,阴性为971,我们使用卡方检验看一看阳性率是否在性别上存在差异。

> chisq.test(table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果))Pearson's Chi-squared test with Yates' continuity correctiondata:  table(MP2064_year_jijie$性别, MP2064_year_jijie$检测结果)
X-squared = 2.6543, df = 1, p-value = 0.1033

我们看到,χ2=2.6543,自由度为1,p=0.1033>0.05,所以可以认为阳性率在性别上的分布没有差异。

> table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果)阳性 阴性男 3148 2963女 2912 2402
> chisq.test(table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果))Pearson's Chi-squared test with Yates' continuity correctiondata:  table(cil_jiahuanzhehao_xiuyear$性别, cil_jiahuanzhehao_xiuyear$检测结果)
X-squared = 12.183, df = 1, p-value = 0.0004823

换一组数据,就有了差异。

http://www.lryc.cn/news/342923.html

相关文章:

  • 基于51单片机的电子钟秒表LCD1602仿真设计( proteus仿真+程序+设计报告+原理图+讲解视频)
  • latex参考文献引用网址,不显示网址问题
  • 详细分析Mybatis与MybatisPlus中分页查询的差异(附Demo)
  • nginx--tcp负载均衡
  • 20240506 深度学习高级技术点
  • 标准汽车试验铁地板的技术要求
  • 【翻译】REST API
  • TypeScript学习日志-第十九天(namespace命名空间)
  • Mac远程桌面windows11
  • GPU术语
  • 上海个人购房提取公积金经历和注意事项(收藏不踩坑)
  • 阿里云API网关 产品的使用笔记
  • 基于H.264的RTP打包中的组合封包以及分片封包结构图简介及抓包分析;FU-A FU-B STAP-A STAP-B简介;
  • OPENAI中Semantic Kernel实现原理以及示例代码用PYTHON来实现
  • 关于路由懒加载的实现
  • 如何去官网下载windows10操作系统iso镜像
  • JavaScript中如何实现函数缓存,函数缓存有哪些应用场景
  • 以中国为目标的DinodasRAT Linux后门攻击场景复现
  • Day 24 数据库管理及数据类型
  • MAC 本地搭建Dify环境
  • vue3使用tsx/jsx时报错:JSX 元素隐式具有类型 “any“,因为不存在接口 “JSX.IntrinsicElements“。
  • 卷价格不如卷工艺降本增效狠抓模块规范化设计
  • [报错解决]Failed to load driver class oracle.jdbc.OracleDriver
  • 前端科举八股文-CSS篇
  • tracert命令
  • goget配置多个golang 运行环境
  • 小程序预览或上传代码时,遇到app.json未找到某个wxml文件的解决方法
  • VUE v-for 数据引用
  • 嵌入式linux学习第一天
  • 基于Springboot的教学辅助系统(有报告)。Javaee项目,springboot项目。