申し訳ありませんApache Nifiの新機能です。だから、私はハイブからデータを引き出し、それをSQLに格納するというデータフローを作りました。私のデータフローにエラーはありません。唯一の問題は、データを繰り返し引き出すことです。Apache Nifiを使用して重複なしでHiveからSQL Serverにデータを引き出す
マイデータの流れがあるが、以下で構成されています
- SelectHiveQL
- SplitAvro
- ConvertAvroToJson
- ConvertJsonTOSQL
- PutSQL
例えばハイブの私のテーブルには、わずか20行を持っているが、私は、データフローを実行して、MS SQLの私のテーブルをチェックするとき。それは5,000行を保存しました。 SelectHiveQLはデータを繰り返し取得しました。
ハイブテーブルで20行または正確な行数だけを引き出すために必要なことは何ですか?
あなたは
それだけでいくつかの非常に長い時間間隔(など日、年、)ごとに1回実行さなるよう、非常に大きなものに実行スケジュールを設定することがあるかもしれないそんなに先生ありがとうございました!! – Eiger