当前位置: 首页 > news >正文

Max Compute 操作记录

编译 max compute-spark

git clone https://github.com/aliyun/MaxCompute-Spark
cd spark-3.x
mvn clean package -DskipTests

在 target 目录下生成 以下两个文件。

spark-examples_2.12-1.0.0-SNAPSHOT-shaded.jar
spark-examples_2.12-1.0.0-SNAPSHOT.jar

2. DataWorks 上传资源

在 DataWorks 手动业务流程,点击【新建】,输入业务名称后,在下面【资源】中创建jar 资源 spark-examples_2.12-1.0.0-SNAPSHOT-shaded.jar。

在手动业务流程而不是数据开发中创建业务名称,是因为在数据开发中创建的是定时任务,需要有触发依赖条件等。
在这里插入图片描述

3. 创建 Spark 任务

点击【数据开发】,新建节点,选择【ODPS Spark】
在这里插入图片描述

3.1 输入以下内容

在这里插入图片描述
点击任务【在运维中心查看】
在这里插入图片描述
点击一个业务流程,出现任务在页面中,点击【重跑】。
在这里插入图片描述
点击【查看运行日志】,进入以下界面。url:https://workbench2-cn-beijing.data.aliyun.com/?defaultProjectId=100059&env=prod&taskId=1000551469325&userProjectId=100059#/runLog
在这里插入图片描述
下面有 application url,点击进入 spark ui
在这里插入图片描述
Spark Executors 信息
在这里插入图片描述
【任务】鼠标点击以下,可以看到如下内容。
在这里插入图片描述

http://www.lryc.cn/news/128150.html

相关文章:

  • Windows 11 + Ubuntu20.04 双系统 坑里爬起来
  • touch手势事件及功能封装
  • 面试问题记录
  • ZooKeeper的应用场景(集群管理、Master选举)
  • 面试算法编程题
  • JVM——JDK 监控和故障处理工具总结
  • 多维时序 | MATLAB实现WOA-CNN鲸鱼算法优化卷积神经网络的数据多变量时间序列预测
  • ZoomIt v7.1
  • E8—Aurora 64/66B ip实现GTX与GTY的40G通信2023-08-12
  • js下载后端返回的文件
  • 计组 | 并行操作
  • rabbitmq容器启动后修改连接密码
  • PHP中的curl详细解析和常见大坑
  • [python] 使用Jieba工具中文分词及文本聚类概念
  • 常见程序搜索关键字转码
  • 细谈商品详情API接口设计
  • Go 1.21新增的内置函数(built-in functions)详解
  • 【云原生,k8s】基于Helm管理Kubernetes应用
  • 字符设备驱动分布注册
  • 在Gazebo中添加悬浮模型后,利用键盘控制其移动方法
  • Java设计模式 (一) 模板方法设计模式
  • PHP在线客服系统推荐
  • (三)行为型模式:3、解释器模式(Interpreter Pattern)(C++示例)
  • Zookeeper 启动闪退
  • jenkins 安装nodejs 14
  • K8S核心组件etcd详解(上)
  • STM32存储左右互搏 I2C总线FATS读写EEPROM ZD24C1MA
  • 微服务—远程调用(RestTemplate)
  • Fine tune简介
  • centos nginx配置ipv4和ipv6的地址都可以访问同一个网站