当前位置: 首页 > news >正文

生产环境_Spark处理轨迹中跨越本初子午线的经度列

        使用spark处理数据集,解决gis轨迹点在地图上跨本初子午线的问题,这个问题很复杂,先补充一版我写的

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.functions._
import org.apache.spark.sql.expressions.Windowimport org.apache.spark.sql.types.{StringType, StructField, StructType}// by_20231215
// 作者:https://blog.csdn.net/qq_52128187?type=blog
object lon_benchuziwuxian {def main(args: Array[String]): Unit = {val conf = new SparkConf().setAppName("Parent_child_v3").setMaster("local[1]")val sc = new SparkContext(conf)val spark = SparkSession.builder.appName("Parent_child_v3").getOrCreate()import spark.implicits._// 数据val data = Seq((1, 178.0, 40.0, "2022-08-15 12:00:00"),(1, -179.0, 45.0, "2022-08-15 12:30:00"),(1, -170.0, 50.0, "2022-08-15 13:00:00"))// 数据集的schemaval columns = Seq("id", "lon", "lat", "time")val trajDataFrame = data.toDF(columns: _*)// 处理跨越本初子午线的经度val processedDataFrame = trajDataFrame.withColumn("lon_processed",when(col("lon") < 0, col("lon") + 360).otherwise(col("lon")))processedDataFrame.show()//    // 处理跨越本初子午线的经度
//    val processedDataFrame = trajDataFrame.withColumn("lon_processed",
//      when(col("lon") < 0, col("lon") + 360).otherwise(col("lon")))
//
//    // 按id和时间排序
//    val sortedDataFrame = processedDataFrame.orderBy("id", "time")
//
//    // 调整经度以避免跨越本初子午线
//    val adjustedDataFrame = sortedDataFrame.withColumn("lon_adjusted",
//      when(abs(col("lon_processed") - lag("lon_processed", 1).over(Window.partitionBy("id").orderBy("time"))) > 180,
//        when(col("lon_processed") > lag("lon_processed", 1).over(Window.partitionBy("id").orderBy("time")), col("lon_processed") - 360)
//          .otherwise(col("lon_processed") + 360)
//      ).otherwise(col("lon_processed"))
//    )
//
//    // 将经纬度点按时间形成一条轨迹字符串
//    val trajStringDF = adjustedDataFrame.groupBy("id").agg(collect_list(struct("lon_adjusted", "lat", "time")).as("trajectory"))
//
//    trajStringDF.show(false)}
}

http://www.lryc.cn/news/262524.html

相关文章:

  • Vue前端与后端放在一起的搭建方式
  • SI24R03国产自主可控RISC-V架构MCU低功耗2.4GHz收发芯片SoC
  • 基于FPGA的温度控制系统设计(论文+源码)
  • C语言训练:三个字符串比较大小,实现两个整数数的交换统计二进制中1的个数
  • module ‘tensorflow‘ has no attribute XXX 报错解决
  • MySQL数据库 DDL
  • 力扣二叉树--总结篇(2)
  • 小米移动端页面练习---重点:导航栏点击下箭头内容的切换以及样式,高亮显示的实现
  • 从零开始创建一个项目,springBoot+mybatisPlus+mysql+swagger+maven
  • 【视点合成】代码解读:生成demo视频
  • Process On在线绘制流程图
  • 【Hadoop-OBS-Hive】利用华为云存储对象 OBS 作为两个集群的中间栈 load 文件到 Hive
  • 直线检测算子
  • 如何在本地Docker中部署MinIO服务并实现远程访问管理界面
  • 逛商场。。。
  • RTrPPG
  • web应用开发技术的一些概念
  • 智能优化算法应用:基于乌燕鸥算法3D无线传感器网络(WSN)覆盖优化 - 附代码
  • 超聚变服务器(原华为服务器)网站模拟器
  • Linux常见压缩指令小结
  • OpenSSL的源码在哪里下载?
  • 使用create-react-app脚手架创建react项目
  • 【网络安全】网络防护之旅 - 点燃网络安全战场的数字签名烟火
  • JVM基础扫盲
  • SpringBoot基于gRPC进行RPC调用
  • 浏览器的事件循环机制(Event loop)
  • THEMIS---Beta Sprint Summary Essay Blog
  • Vue中实现分布式动态路由的基本实现步骤介绍
  • 【Leetcode】计算器
  • 巧妙的使用WPF中的资源