当前位置: 首页 > news >正文

DolphinScheduler 集成DataX

DataX 与 DolphinScheduler 同服务器部署步骤

  1. 下载 DataX
wget https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz
tar -zxvf datax.tar.gz -C /home/  # 解压到指定目录
  1. 配置 DataX 环境变量
    编辑 DolphinScheduler 的环境配置页面,按以下内容填写:
export PYTHON_LAUNCHER=/usr/bin/python        # Python 执行路径(根据实际路径调整)
export DATAX_LAUNCHER=/home/datax/bin/datax.py # DataX 主程序路径
  1. 关键说明
    同服务器限制:DolphinScheduler 调用 DataX 需通过 Python 直接执行脚本,因此两者必须在同一台服务器。
    路径验证:
    确保 python 路径正确:which python
    确保 DataX 解压后 datax.py 路径存在:ls /home/datax/bin/datax.py
  2. 后续操作
    在 DolphinScheduler 中创建任务时,选择 DataX 任务类型,系统会自动读取配置的路径执行。
    在这里插入图片描述
    配置datax及python环境
    配置地址在/dolphinscheduler-bin/bin/env/dolphinscheduler_env.sh
export DATAX_HOME=/data/datax

修改完DATAX_HOME ,重启ds即可,操作完后,可直接使用dophinscheduler的datax节点
注意事项
若 Python 路径不同,替换 /usr/bin/python 为实际路径(如 /usr/bin/python3)。
DataX 版本需与 DolphinScheduler 兼容,建议使用官方最新稳定版。
权限问题:确保 DolphinScheduler 服务账户对 /home/datax/ 有读写权限。

http://www.lryc.cn/news/610319.html

相关文章:

  • 【REACT18.x】封装react-rouer实现多级路由嵌套,封装登录态权限拦截
  • 《Python 实用项目与工具制作指南》· 2.1 输入输出
  • 基于Matlab实现LDA算法
  • 【机器学习】(算法优化一)集成学习之:装袋算法(Bagging):装袋决策树、随机森林、极端随机树
  • MiDSS复现
  • 测试-概念篇(3)
  • 基于SpringBoot的OA办公系统的设计与实现
  • 【Mac】OrbStack:桌面端虚拟机配置与使用
  • 防火墙认证用户部署
  • DPDK中的TCP头部处理
  • 在安卓中使用 FFmpegKit 剪切视频并添加文字水印
  • uiautomator2 编写测试流程-登陆后的酷狗01
  • Django集成图片验证码功能:基于django-simple-captcha实现
  • MySQL Router
  • Elasticsearch Ingest Pipeline 实现示例
  • C 语言枚举、typedef 与预处理详解
  • C语言的数组与字符串
  • AI产品经理面试宝典第61天:AI产品体验、数据安全与架构实战解析
  • 倒排索引:Elasticsearch 搜索背后的底层原理
  • 无公网环境下在centos7.9上使用kk工具部署k8s平台(amd64架构)
  • 数字信号处理_编程实例1
  • 【前端】JavaScript基础知识及基本应用
  • C++ STL list容器详解:从基础使用到高级特性
  • AI绘图-Stable Diffusion-WebUI的基本用法
  • SwiftUI ios开发中的 MVVM 架构深度解析与最佳实践
  • 深度学习零基础入门(4)-卷积神经网络架构
  • (JAVA)自建应用调用企业微信API接口,设置企业可信IP
  • 流量见顶时代,知识付费 IP 的破局逻辑
  • 汇川PLC通过ModbusTCP转Profinet网关连接西门子PLC配置案例
  • 飞算 JavaAI 实战:从代码生成到架构优化的全场景应用指南