当前位置: 首页 > news >正文

Presto VS Spark

环境配置

5个节点,每个节点10G内存。

测试SQL,每个执行3次,求平均,对比计算性能。

版本信息

  • Spark:2.3.1
  • Presto: 0.208

10亿量级查询性能对别

Spark:

spark-sql> select sex,count(1) from contact10 group by sex;
F 499976538
M 500023462
Time taken: 2.55 seconds, Fetched 2 row(s)

Presto:

presto> select sex,count(1) from contact10 group by sex;
sex | _col1
-----+-----------
M | 500023462
F | 499976538
(2 rows)Query 20180827_131349_00018_8qdyf, FINISHED, 5 nodes
Splits: 1,019 total, 1,019 done (100.00%)
0:05 [1000M rows, 123MB] [215M rows/s, 26.4MB/s]

Spark计算比Presto快一倍,胜出。

1000W量级查询性能对比

平分秋色,Spark会好那么一丢丢。

  • Spark: 0.43s
  • Presto: 0.5s

100条以内的表查询性能对比

Presto无论聚合计算,还是全表扫描查询,都略比Spark有优势,不过总的查询不大,性能优势可以忽略。

  • Spark:0.19s
  • Presto:0.11s

发现的问题

Presto: 不支持Hive的View

结论

测试结果上和京东的朋友做的对比测试确实比较吻合。

从生态及性能两方面考虑,Presto相比Spark2.x确实没啥优势了。

http://www.lryc.cn/news/62046.html

相关文章:

  • 为什么我们能判断声音的远近
  • 那些关于DIP器件不得不说的坑
  • 论文笔记:基于U-Net深度学习网络的地震数据断层检测
  • kafka单节点快速搭建
  • 【MySQL】(6)常用函数
  • Linux学习 Day1
  • Hibernate中的一对多和多对多关系
  • Linux系统之部署Samba服务
  • 回顾产业互联网的发展历程,技术的支撑是必不可少的
  • 关于gas费优化问题
  • Linux——中断和时间管理(中)
  • 嵌入式软件中常见的 8 种数据结构详解
  • vue 修改当前路由参数并刷新界面
  • 视频处理之视频抽帧的python脚本
  • 【youcans 的 OpenCV 学习课】22. Haar 级联分类器
  • 如何避免知识盲区 《人生处处是修行》 读书笔记
  • vue返回上一页自动刷新方式
  • 查询SERVER正在执行的SQL语句
  • 现代密码学--结课论文---《70年代公钥传奇》
  • cf1348B phoenix and beauty(双指针滑动窗口的构造)
  • 一文读懂JAVA的hashCode方法:原理、实现与应用
  • RocketMQ部署
  • 43岁程序员,投了上万份简历都已读不回,只好把年龄改成40岁,这才有了面试机会,拿到了offer!...
  • MySQL分区表相关知识总结
  • outlook邮箱pc/mac客户端下载 含最新版
  • 缓存雪崩、缓存穿透、缓存击穿分别是什么?如何解决?
  • VBA实战篇学习笔记02 Err错误处理
  • 【Git】拉取代码/提交代码
  • 产品预览 | 系统仿真与三维专业场仿真融合——MWORKS模型降阶工具箱
  • 我们都遇到过的这些ajax代码到底什么意思?