2016-05-16 6 views
1

私はサブワークフローを持つワークフローを持っています。 「メイン」ワークフローはディレクトリのファイルサイズをチェックし、サイズがトリガ値より大きい場合、サブワークフローが開始されます。oozieで最後にワークフローを実行した時刻を確認します

今や、メインワークフローの現在の実行からの時間と、サブワークフローの最後の実行のタイムスタンプが追加のトリガーを必要とします。現時点では、hdfsファイルやハイブテーブルにタイムスタンプを書き込んだり、コミットラインインターフェイスの出力をmanglingすることしかできません。

oozieワークフローまたはプロパティファイル内でこれを解決するために、より洗練された方法を知っている人はいますか?

+0

その他の非エレガントなオプション:Oozieの出力をマングリングするREST API。基礎となるメタストアをSQL *(yuck)*でクエリします。 –

+0

私はこれ以上解決策が見つからなかったので、これを解決策として使用しています: 'oozie jobs -oozie $ {OOZIE_HOST}/oozie -localtime -len 1 -filter name = $ {WORKFLOW} | grep $ {WORKFLOW} | rev |カット-c -25 | rev | sed -eの/ [^ 0-9] // g'' ..もし何かがうまくいかなかったり、ワークフローが見つからない場合は、結果はnullです。 –

答えて

0

これ以上解決策が見つからなかったので、これを解決策として使用しています。oozie jobs -oozie $ {OOZIE_HOST}/oozie -localtime -len 1 -filter name = $ {WORKFLOW} | grep $ {WORKFLOW} | rev |カット-c -25 | rev | sed -e 's/[^ 0-9] // g' ..何かがうまくいかなかったり、ワークフローが見つからない場合は、結果はnullです。

関連する問題