开源 · Apache Airflow
Airflow:Python DAG 工作流编排
定时/事件触发、任务依赖、可视化监控与插件生态
Apache Airflow 是开源的工作流编排器,用 Python 定义 DAG 管理数据管道与批处理任务,支持调度、重试、回填、依赖管理与丰富的 Provider 插件,适合数据工程与分析团队自托管。
Python DAG 定义
用代码定义任务与依赖,支持动态 DAG 与模板化配置。
调度与重试
CRON/时间表、事件触发、重试与 SLA/回填管理。
可视化监控
Web UI 展示 DAG、甘特与日志,支持手动重跑与任务清理。
生态与扩展
大量 Provider 连接器,Kubernetes/Local/Celery/Executor 多种执行模式。
适用场景 / Use cases
- 批处理与 ELT 编排
- 数据质量与依赖感知调度
- 机器学习训练/部署流水线
- 自托管的可审计调度平台