私はAirflowを使用してバッチジョブをスケジュールしています。毎晩1つのDAG(A)と毎月1回実行する別のDAG(B)があります。 Bは成功裏に完了したAに依存する。ただし、Bの実行には時間がかかります。したがって、SLAレポートをより良くするために、別のDAGに保存したいと考えています。エアフローのDAG間の依存関係を設定するにはどうすればよいですか?
DAGの実行をDAG Aの実行に依存するようにするにはどうすればよいですか?
私はAirflowを使用してバッチジョブをスケジュールしています。毎晩1つのDAG(A)と毎月1回実行する別のDAG(B)があります。 Bは成功裏に完了したAに依存する。ただし、Bの実行には時間がかかります。したがって、SLAレポートをより良くするために、別のDAGに保存したいと考えています。エアフローのDAG間の依存関係を設定するにはどうすればよいですか?
DAGの実行をDAG Aの実行に依存するようにするにはどうすればよいですか?
この動作は、ExternalTaskSensorというオペレータを使用して実現できます。 あなたの仕事DAG(B)中の(B1)は、スケジュールおよびDAG内のタスク(A2)の成功のために待つことになる(A)
TriggerDagRunOperatorが同様に使用することができるように見えますし、いくつかのロジックを追加するためにpython呼び出し可能を使用することができます。ここで説明したように:https://www.linkedin.com/pulse/airflow-lesson-1-triggerdagrunoperator-siddharth-anand
しかし、依存関係を視覚化することはできません。 – nono
@nonoはい。あなたはしません。 –
これをお勧めしますか?私はDagA(5つのタスクから成る)とDagB(5つの別々のタスク)を待つ必要がある毎日のタスクを持っています。私のDagCは、これらの両方が成功するのを待ってから、DBから2つのテーブルをクエリし、それらを集約して結合し、いくつかの電子メール/ファイルを送信する必要があります。 – trench