2015-10-23 13 views
8

Oozieワークフローとコーディネータとバンドルの違いは何ですか?Oozieワークフローとコーディネータとバンドルの違い

Oozieワークフローは一連のアクションを定義します。また、実行するたびに手動で呼び出す必要があります。 同じワークフローをコーディネーターを介してスケジュールできる場所。 この理解は正しいですか?

さらにバンドルは何ですか?

コーディネーターのセットをスケジュールするために再び使用されると思います。次に、1人のワークフローが別のワークフローを持つように、1人のコーディネータを他のコーディネータのスケジュールに使用できないのはなぜですか。

+2

コーディネーター1人が午前7時にコーディネーター2が午前10時にスケジュールされます。これら2人を一緒にバンドルするとき 1)バンドルもスケジュールする必要がありますか? 2)コーディネーター1が午前10時を過ぎて失敗するか遅れた場合、コーディネーター2の実行を停止するバンドルはありますか?あなたは明確にしてください。 – chandra

答えて

5

ワークフロー:

これは、アクションのシーケンスです。これは、XMLで書かれており、アクションは、などハイブ、豚を減らすマッピングすることができます

コーディネーター:

それは一連の条件が満たされているアクションをトリガーするプログラム(一般的にワークフロージョブ)があります。

それがバンドルジョブの時間を指定することができるコーディネーターjobs.Weのセットをバッチ処理より高いレベルのoozie抽象化として定義される:条件は

バンドル時間周波数、他の外部イベント等とすることができますまた始める。

+0

お返事ありがとうございます。しかし、これらの定義は、コーディネーターと比較してバンドルの違いと必要性を明確にしていません。 –

+0

ちょうど高いレベルの抽象化...ワークフローコーディネータのグループ...コーディネータのバンドルのグループ.... – madhu

1

ワークフローには、hadoopジョブを実行するための時間指定がありません。 コーディネータージョブには、frequencyタグを使用しているcoordinator.xmlのジョブに関する時間指定があります。 集合コーディネーター・ジョブは、バンドル・ジョブとみなされます。 バンドルジョブでは、個々のユーザーはそれぞれのジョブに対してjob.propertiesを使用して独自のジョブを割り当てることができます。それはマネージャーに良くなるように、グループコーディネーターのカップルは、開始/停止、表示することができ、バンドルを使用して、私の理解のために

0

、...

我々は二つのデータパイプラインを持っている可能性が高い

は、一つは、ログのためであります(collect/parse/ETL)、ビジネスロジック用です。

次に、さまざまな種類のコーディネーターをグループ化する2つのバンドルを作成します。

関連する問題