当前位置: 首页 > news >正文

airflow是什么

Airflow 简介

Airflow是一个基于有向无环图(DAG)的可编程、调度和监控的工作流平台,它可以定义一组有依赖的任务,按照依赖依次执行。airflow提供了丰富的命令行工具用于系统管控,而其web管理界面同样也可以方便的管控调度任务,并且对任务运行状态进行实时监控,方便了系统的运维和管理。

Airflow 特性

  1. airflow是一个用来对例行任务进行调度的平台,可以将所有有依赖关系的任务整合在一起。
  2. airflow有两个比较重要的概念:DAG和task,一个task表示一个任务,多个有依赖关系的task组织在一起就是一个DAG。
  3. airflow中DAG和task都需要写一段python代码来实现,使用者需要有部分python基础知识。
  4. 我们的每一个任务(task)都可以归纳为一种操作(Operator):比如执行一段shell指令可以理解为BashOperator、运行一个spark任务可以理解为一个SparkOperator。有一些比较特殊的操作,比如判断一个目录是否存在,在airflow中属于SensorOperator。
  5. 大数据部对airflow提交spark、mr、hive等集群任务都使用genie提交,对这类任务统一封装成了GenieOperator。(genie是另一个开源服务,通过genie可以远程提交到多个集群)
http://www.lryc.cn/news/123016.html

相关文章:

  • 训练用于序列分类任务的 RoBERTa 模型的适配器
  • Linux之awk判断和循环
  • Django入门
  • uniapp 格式化时间刚刚,几分钟前,几小时前,几天前…
  • JProfiler —CPU评测
  • 994. 腐烂的橘子
  • Rx.NET in Action 第三章学习笔记
  • Windows11环境下VS2019调用Pytorch语义分割模型(C++版)
  • Milkv Duo 以太网使用与配置
  • bash: make: command not found
  • 热点如何用于期刊写作——以chatGPT为例
  • IGV.js 的完全本地化运行探索
  • 网络安全渗透测试之靶场训练
  • Java课题笔记~ Spring 的事务管理
  • 仿到位|独立版家政上门预约服务小程序家政保洁师傅上门服务小程序上门服务在线派单源码
  • Observability:识别生成式 AI 搜索体验中的慢速查询
  • 接口测试及接口抓包常用的测试工具
  • CH342/CH343/CH344/CH347/CH9101/CH9102/CH9103/CH9104 Linux串口驱动使用教程
  • 反射和工厂设计模式---工厂设计模式
  • 【算法——双指针】LeetCode 283 移动零
  • 腾讯云轻量服务器和云服务器的CPU处理器有差别吗?
  • Redis_亿级访问量数据处理
  • Java-类型和变量(基于C语言的补充)
  • 机器学习笔记:李宏毅diffusion model
  • STM32--TIM定时器(2)
  • git Authentication failed
  • 【软考】2023系统架构设计师考试
  • opencv基础55-获取轮廓的特征值及示例
  • OpenCV图像处理——形态学操作
  • 修改VS Code终端的显示行数