当前位置: 首页 > news >正文

R语言中apply系列函数详解

文章目录

    • apply
    • lapply, sapply, vapply
    • rapply
    • tapply
    • mapply

R语言系列:

  • 编程基础💎循环语句💎向量、矩阵和数组💎列表、数据帧
  • 排序函数💎apply系列函数

R语言的循环效率并不高,所以并不推荐循环以及循环嵌套。为了实现循环功能的情况下,兼顾效率,R语言提供了apply系列函数,用于对规则的数据进行函数式的迭代处理。

apply

apply函数作用于两个维度以上的数组或矩阵,其必要的输入参数有三,分别是待处理数据、用于循环的维度、处理函数,示例如下

data <- matrix(c(1:20), 5, 4)
apply(data, 1, mean)
# [1]  8.5  9.5 10.5 11.5 12.5

上述代码的含义是,对data的第一个维度,执行平均值mean操作,换言之,对每一行取平均值。data是5行4列的矩阵,每行取平均值,可得到拥有4个元素的向量。

apply也支持对多个坐标轴的数据进行操作,仍以data为例,若想对所有元素取根号,则可以写为下面这样,其结果于sqrt(data)相同

> apply(data, 1:2, sqrt)[,1]     [,2]     [,3]     [,4]
[1,] 1.000000 2.449490 3.316625 4.000000
[2,] 1.414214 2.645751 3.464102 4.123106
[3,] 1.732051 2.828427 3.605551 4.242641
[4,] 2.000000 3.000000 3.741657 4.358899
[5,] 2.236068 3.162278 3.872983 4.472136

lapply, sapply, vapply

apply不能作用于一维数组,lapplysapply补充了这一功能

> arr <- apply(data, 1, mean)
> apply(arr, 1, sqrt)
Error in apply(arr, 1, sqrt) : dim(X)的值必需是正数
> sapply(arr, sqrt)
[1] 2.915476 3.082207 3.240370 3.391165 3.535534
> lapply(arr, sqrt)
[[1]]
[1] 2.915476[[2]]
[1] 3.082207[[3]]
[1] 3.24037[[4]]
[1] 3.391165[[5]]
[1] 3.535534

从上面代码可知,二者主要区别是返回值,sapply会根据实际情况调整返回值,其返回逻辑为

  • 1个列表->向量
  • 多个长度相同的列表->矩阵,
  • 多个长度不同的列表->列表

相比之下,vapply可以更加灵活地选择输出数据类型

> vapply(arr, sqrt, numeric(1))
[1] 2.915476 3.082207 3.240370 3.391165 3.535534

rapply

rapply可以处理嵌套列表,其与lappy的区别试一下就知道

> x <- list(1,2,c(1:5))
> sapply(x, sqrt)
[[1]]
[1] 1[[2]]
[1] 1.414214[[3]]
[1] 1.000000 1.414214 1.732051 2.000000 2.236068> rapply(x, sqrt)
[1] 1.000000 1.414214 1.000000 1.414214 1.732051 2.000000 2.236068

换言之,rapply在执行的过程中,会不断地检查是否存在列表,如果存在列表,就把这个列表打开,其可用参数除了x, fun之外,还可指定处理的类别classes,以及处理方法howhow可选三个参数

  • "replace" 直接替换list中原来的元素
  • "list" 新建一个列表,元素类型复合classes则调用FUN
  • "unlist" 相当于对"list"模式下的结果调用unlist(recursive=TRUE)

tapply

tapply可对输入数据进行分组操作,下面以鸢尾花数据作为示例,来体验一下tapply的用法

> tapply(iris$Sepal.Length, iris$Species, mean)setosa versicolor  virginica 5.006      5.936      6.588 

iris提供了三种鸢尾花的长度、宽度等数据,其中iris$Species为其种类信息。上面代码的含义是,对iris的长度,按照相同的Species取平均值。

mapply

mapply的使用逻辑是,对两组相同维度的数据进行某种函数操作,类似于执行下面的操作

for(i in 1:N){func(L1[i], L2[i])
}

下面以两种不同类别的鸢尾花做个示例

L1<-iris[iris$Species=="setosa",]
L2<-iris[iris$Species=="virginica",]
max(L1$Sepal.Length, L2$Sepal.Length)
# 返回值为7.9,计算了所有数据中的最大值

下面通过mapply,可以发现对每种类别的50组数据进行了以一比对,并选择出了最大值

> mapply(max, L1$Sepal.Length, L2$Sepal.Length)[1] 6.3 5.8 7.1 6.3 6.5 7.6 4.9 7.3 6.7 7.2 6.5 6.4 6.8 5.7 5.8
[16] 6.4 6.5 7.7 7.7 6.0 6.9 5.6 7.7 6.3 6.7 7.2 6.2 6.1 6.4 7.2
[31] 7.4 7.9 6.4 6.3 6.1 7.7 6.3 6.4 6.0 6.9 6.7 6.9 5.8 6.8 6.7
[46] 6.7 6.3 6.5 6.2 5.9
http://www.lryc.cn/news/59210.html

相关文章:

  • 红黑树探险:从理论到实践,一站式掌握C++红黑树
  • CDH6.3.2大数据集群生产环境安装(七)之PHOENIX组件安装
  • 【C++要笑着学】搜索二叉树 (SBTree) | K 模型 | KV 模型
  • 微信小程序开发 | 小程序开发框架
  • 气候系统设计
  • 如何使用Thymeleaf给web项目中的网页渲染显示动态数据?
  • 01 | 电机常用语
  • Leetcode.2601 质数减法运算
  • DP7416国产192K数字音频接收芯片兼容替代CS8416
  • 全球土壤湿度数据获取方法
  • 在proteus中仿真arduino实现矩阵键盘程序
  • 【ROS2指南-5】理解ROS2服务
  • 探索Apache Hudi核心概念 (3) - Compaction
  • 100Wqps异地多活,得物是怎么架构的?
  • 35岁的测试工程师被公司强行辞退,感叹道:我以前就该好好努力了
  • ASP.NET动态Web开发技术第5章
  • 【数据结构与算法篇】时间复杂度与空间复杂度
  • HTTP API接口设计规范
  • 数据一致性校验(pt-table-checksum)
  • Talk预告 | 新加坡国立大学郑奘巍 AAAI‘23 杰出论文:大批量学习算法加速推荐系统训练
  • 肖 sir_就业课__004项目流程(H模型)
  • snipaste 截图工具——可以使图片悬浮在任何软件上,方便对比
  • Docker 快速部署Springboot项目
  • 【LeetCode: 剑指 Offer II 112. 最长递增路径 | 递归 | DFS | 深度优先遍历 | 记忆化缓存表】
  • hive 入门 一般用于正式环境 修改元数据(二)
  • 在RedHat系统上使用firewall-cmd命令可以将端口打开
  • 分享(五):免费可用的多种类 API 大全集合整理
  • 8.1 假设验证的基本概念
  • C语言基础
  • Docker教程:如何将Helix QAC创建为一个容器并运行?