当前位置: 首页 > news >正文

R语言【dplyr】——filter保留符合筛选条件的行,以数据的行为单位,创建子集

Package dplyr version 1.1.4


Parameters

filter(.data, ..., .by = NULL, .preverse = FALSE)

参数【.data】:一个数据集(data frame),数据集扩展(比如:tibble),或者 lazy data frames(比如:来自 dbplyr 或 dtplyr)。

参数【...】:数据过滤表达式(data-masking expression),返回的是逻辑值,根据参数【.data】中的变量进行定义。如果包含多个表达式,则使用 & 运算符合并。只保留所有条件判断均为 TRUE 的记录

参数【.by】:<tidy-select>可选的,仅用于此操作的列分组选择,可替代 group_by()

参数【.preserve】:与参数【.data】分组时相关。如果 .preserve = FALSE(默认值),分组结构将根据生成的数据重新计算,否则分组结构将保持不变。


Tips

filter() 函数用于创建参数【.data】的子集行,将参数【...】中的表达式应用于列值,以确定应保留哪些行。它既可应用于分组数据,也可应用于未分组数据。然而,dplyr 还不够智能,无法优化不需要分组计算的分组数据集的过滤操作。因此,过滤未分组数据的速度通常要快得多。


Value

filter() 函数返回一个与参数【.data】相同类型的对象。输出结果具有以下属性:

  • 行是输入的子集,但以相同的顺序出现。
  • 列未作修改。
  • 组的数量可能会减少(如果参数【.preserve】不是 TRUE)。
  • 数据集属性保留不变。

Available filter

在构建用于过滤数据的表达式时,有许多函数和运算符非常有用:

  • ==>>= 等等
  • &|xor()
  • is.na()
  • between()near()

Process groups

由于过滤表达式是在组内计算的,因此在分组的 tibbles 上可能会产生不同的结果。只要涉及聚合、滞后或排序功能,就会出现这种情况。

比较一下未分组的过滤:

starwars %>% filter(mass > mean(mass, na.rm = TRUE))

再理解一下分组的过滤:

starwars %>% group_by(gender) %>% filter(mass > mean(mass, na.rm = TRUE))

在未分组版本中,filter() 将每一行的 mass 值与全局平均值(整个数据集的平均值)进行比较,只保留 mass 大于全局平均值的行。与此相反,分组版本会分别计算每个 gender 组的平均 mass ,并保留 mass 大于相关性别内平均值的行。

http://www.lryc.cn/news/268093.html

相关文章:

  • 几种串口扩展电路
  • 实战10 角色管理
  • Lua的底层原理与C#交互原理浅析【更新中】
  • 鸿蒙项目二—— 注册和登录
  • Dijkstra(迪杰斯特拉)算法总结
  • 设计模式?!
  • Pytorch项目,肺癌检测项目之三
  • 深圳鼎信|输电线路防山火视频监控预警装置:森林火灾来袭,安全不留白!
  • 【Bash/Shell】知识总结
  • 单例模式(C++实现)
  • ElasticSearch 聚合统计
  • SpringIOC之MethodBasedEvaluationContext
  • 【网络安全 | 网络协议】结合Wireshark讲解TCP三次握手
  • 钦丰科技(安徽)股份有限公司携卫生级阀门管件盛装亮相2024发酵展
  • Python模拟动态星空
  • 最新技术整理3款开源免费直播推流工具,实现实时视频推流、视频拉流,目标端可以是服务器、云平台、移动设备等(附源码)
  • shell ——数组
  • GO语言基础笔记(五):包的介绍
  • 【Unity6.0+AI】Sentis加载模型识别手写数字案例实现
  • VScode跑通Remix.js官方的contact程序开发过程
  • 讲座思考 | 周志华教授:新型机器学习神经元模型的探索
  • docker构建镜像及项目部署
  • ARM串口通信编程实验
  • MyBatis的延迟加载(懒加载)
  • 嵌入式-stm32-用PWM点亮LED实现呼吸灯
  • C语言初学7:循环
  • 力扣69. x 的平方根
  • go语言学习计划。
  • 设计模式之-3种常见的工厂模式简单工厂模式、工厂方法模式和抽象工厂模式,每一种模式的概念、使用场景和优缺点。
  • docker run --help帮助文档