当前位置: 首页 > news >正文

Pyspark中pyspark.sql.functions常用方法(4)

文章目录

  • pyspark sql functions
    • forall 判断array是否满足all
    • filter 过滤
    • zip_with 数组合并

pyspark sql functions

forall 判断array是否满足all

df = spark.createDataFrame([(1, ["bar"]), (2, ["foo", "bar"]), (3, ["foobar", "foo"])],("key", "values")
)
df.show()
+---+-------------+
|key|       values|
+---+-------------+
|  1|        [bar]|
|  2|   [foo, bar]|
|  3|[foobar, foo]|
+---+-------------+
df.select(forall("values", lambda x: x.rlike("foo")).alias("all_foo")).show()
+-------+
|all_foo|
+-------+
|  false|
|  false|
|   true|
+-------+

filter 过滤

df = spark.createDataFrame([([1, None, 2, 3],), ([4, 5, None, 4],)], ['data'])
df.show()
+---------------+
|           data|
+---------------+
|[1, null, 2, 3]|
|[4, 5, null, 4]|
+---------------+
df.select(fs.filter(df.data,lambda x: x>1).alias('filter')).show()
+---------+
|   filter|
+---------+
|   [2, 3]|
|[4, 5, 4]|
+---------+

zip_with 数组合并

使用函数将两个给定的数组按元素合并为一个数组。如果一个数组较短,则在应用函数之前,在末尾附加null以匹配较长数组的长度。

df.select(fs.zip_with("xs", "ys", lambda x, y: x ** y).alias("powers")).show(truncate=False)
+---------------------------+
|powers                     |
+---------------------------+
|[1.0, 9.0, 625.0, 262144.0]|
+---------------------------+
http://www.lryc.cn/news/472666.html

相关文章:

  • Nginx 配置基于IP 地址的 Web 服务器
  • 【TVM 教程】线性和递归核
  • 猫主福利大放送,双11猫奴们的购物狂欢节 养猫必备清单
  • Linux中gcc的使用
  • React 组件 API
  • 一个使用接口模式、工厂模式、模板方法模式的日志文件系统
  • openjdk17 C++源码是怎么给java字段赋值的
  • C++初阶(八)--内存管理
  • C# 企业微信机器人推送消息 windows服务应用程序的使用
  • 社区交流系统设计与实现
  • 【模型学习之路】手写+分析bert
  • Redis学习文档(常见面试题)
  • 【C++刷题】力扣-#594-最长和谐子序列
  • MoveIt 控制自己的真实机械臂【2】——编写 action server 端代码
  • C#制作学生管理系统
  • python Pandas合并(单元格、sheet、excel )
  • OJ在线编程常见输入输出练习【JavaScript】
  • 新能源汽车空调系统:绿色出行的舒适保障
  • Date工具类详细汇总-Date日期相关方法
  • TMUX1308PWR规格书 数据手册 具有注入电流控制功能的 5V 双向 8:1单通道和 4:1 双通道多路复用器芯片
  • 证件照怎么换底色?简单又快速!不看后悔
  • Rust 基础语法与常用特性
  • 一、开发环境的搭建
  • Docker:存储原理
  • ts:数组的常用方法(push、pop、shift、unshift、splice、slice)
  • 物联网网关确保设备安全
  • Vue学习笔记(五)
  • Nestjs返回格式小结
  • 【力扣刷题实战】相同的树
  • Golang | Leetcode Golang题解之第515题在每个树行中找最大值