2017-12-28 13 views
1

現在、データファクトリV1を使用しています。データ上流側の依存関係のファクトリ待機タイムアウト

は、私は2つのチェーン活動とのパイプラインを持っています。最初のアクティビティは、SQL ServerからData Lake Storeの.tsvファイルにテーブルを抽出するコピーアクティビティです。

。 2つ目のアクティビティは、以前作成した.tsvファイルのデータを収集し、Data Lakeデータベースの既存のテーブルに追加するData Lake AnalyticsのU-SQLアクティビティです。

はもちろん、私は最初の活動は、私は第二の活動に入力データとして最初のアクティビティから出力データセットを使用した後、第2の活動を実行すると、それが正常に動作します。

ただし、最初のアクティビティが失敗した場合、2番目のアクティビティは "Waiting:Dataset dependencies(上流の依存関係は準備ができていません)"の状態でスタックされます。

私は、第2のアクティビティに対してpolicy-> timeoutプロパティを設定しましたが、このアクティビティが開始された後にのみ動作するように見えます。それで、アクティビティは決して始まらないので、タイムアウトしておらず、止まっています。

この「待機中」のタイムアウトを設定するにはどうすればよいですか?

ありがとうございました

答えて

0

これはv1の動作方法です。アップストリームデータセットに障害が発生した場合、第1のデータセットが正常に完了するまで、第2のデータセットは待機状態にとどまります。

スケジュールを使用している場合は、最初のアクティビティで問題を修正し、障害の発生したスライスをもう一度実行することをお勧めします。 1回限りのパイプラインで作業している場合は、問題を修正してからパイプライン全体を再度実行する必要があります。

タイムアウトは、Data Factory documentationで書かれているように、実際に処理が開始されたときにのみ機能します。

スライス上のデータ処理時間がタイムアウト値を超えると、そのタイムアウト値は取り消され、システムは処理を再試行します。再試行の回数は、再試行のプロパティによって異なります。タイムアウトが発生すると、ステータスはTimedOutに設定されます。