Questions tagged «directed-acyclic-graphs»



1
尝试根据文件名数组从父级dag创建动态subdag
我正在尝试使用气流将s3文件从“非删除”存储桶(意味着我无法删除文件)移动到GCS。我不能保证每天都会有新文件,但是我必须每天检查新文件。 我的问题是动态创建subdag。如果有ARE文件,则需要subdags。如果没有文件,则不需要子目录。我的问题是上游/下游设置。在我的代码中,它确实可以检测文件,但不会像预期的那样启动子数据。我想念一些东西。 这是我的代码: from airflow import models from airflow.utils.helpers import chain from airflow.providers.amazon.aws.hooks.s3 import S3Hook from airflow.operators.python_operator import PythonOperator, BranchPythonOperator from airflow.operators.dummy_operator import DummyOperator from airflow.operators.subdag_operator import SubDagOperator from airflow.contrib.operators.s3_to_gcs_operator import S3ToGoogleCloudStorageOperator from airflow.utils import dates from airflow.models import Variable import logging args = { 'owner': 'Airflow', 'start_date': dates.days_ago(1), 'email': …

1
仅当使用Python中的DAG在AWS athena表中可用的新分区/数据可用时,如何触发Airflow任务?
我有一个如下的场景: 仅在源表(Athena)中有新数据可用时才触发Task 1和Task 2。一天中进行新的数据分区时,应该触发Task1和Task2。 触发Task 3仅完成Task 1和Task 2 Task 4仅触发完成Task 3 我的密码 from airflow import DAG from airflow.contrib.sensors.aws_glue_catalog_partition_sensor import AwsGlueCatalogPartitionSensor from datetime import datetime, timedelta from airflow.operators.postgres_operator import PostgresOperator from utils import FAILURE_EMAILS yesterday = datetime.combine(datetime.today() - timedelta(1), datetime.min.time()) default_args = { 'owner': 'airflow', 'depends_on_past': False, 'start_date': yesterday, 'email': FAILURE_EMAILS, …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.