Airflow 入门
简介
Airflow 是一款 Python 编写的工作流控制软件。它使用 DAG(有向无环图) 的方式将不同的任务组织起来,按照编码顺序进行执行。
容器化部署
使用 curl 命令拉取启动脚本
1
| curl -LfO 'https://airflow.apache.org/docs/apache-airflow/2.1.2/docker-compose.yaml'
|
创建 DAG 脚本路径
1 2
| mkdir ./dags ./logs ./plugins echo -e "AIRFLOW_UID=$(id -u)\nAIRFLOW_GID=0" > .env
|
系统初始化
1
| docker-compose up airflow-init
|
启动容器
检查容器运行情况
登录网页
注:airflow
同时作为账号和密码
实体服务安装
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| export AIRFLOW_HOME=~/airflow
pip install "apache-airflow==${AIRFLOW_VERSION}" --constraint "${CONSTRAINT_URL}"
airflow db init
airflow users create \ --username admin \ --firstname Peter \ --lastname Parker \ --role Admin \ --email spiderman@superhero.org
airflow webserver --port 8080
airflow scheduler
|