こんにちは、sqoopコネクタ経由でMySQLからhdfsにデータをロードしました。既存のデータ間の行が更新された場合、sqoop内の既存の行のデータ値を更新するためのクエリはありますか?私はインクリメンタルアップデートについて知っていますか?インクリメンタルアップデートでは既存のローもアップデートされますか?私はsqoopを初めて使っていますか?sqoopのインクリメンタルアップデート
0
A
答えて
0
はい、インクリメンタルインポートを実行するときは、lastmodified
モードを使用する必要があります。 documentationによれば:
Sqoopでサポートされている代替テーブル更新戦略は LASTMODIFIEDモードと呼ばれます。ソーステーブル の行が更新される可能性があり、そのような各更新によって、最後に変更された列 の値が現在のタイムスタンプに設定されます。チェック の列に、 - last-valueで指定されたタイムスタンプよりも新しいタイムスタンプが格納されている行がインポートされます。
インクリメンタルインポートの最後に、 の値が、後でインポートするために--last-valueとして指定されている場合、 の画面に出力されます。後続のインポートを実行する場合は、新しいデータまたは更新されたデータのみをインポートするために、 --last-valueをこのように指定する必要があります。これは、増分インポート を保存されたジョブとして作成することによって自動的に処理されます。これは、定期的なインクリメンタルインポートを実行するための好ましいメカニズムです。詳細については、この文書の の保存されたジョブのセクションを参照してください。このモードでは、日付値(のような
date
、time
、datetime
とtimestamp
)を保持している列が必要であることを念頭に置いて
ベア。
This answerは、merge-key
を使用して既存の値の代替インポート方法を示しています。
関連する問題
- 1. ハイブテーブルの更新にsqoopインクリメンタルアップデートを使用する
- 2. CamelのHTTPコンポーネントを使用したインクリメンタルアップデート
- 3. luceneのインクリメンタルアップデートに関する問題
- 4. Sqoopインポートの問題
- 5. sqoop Hiveのissueに
- 6. Sqoopジョブ例外
- 7. Sqoopインポートが
- 8. SQOOP INCR load
- 9. Apache sqoopエラー
- 10. Sqoopのエクスポートの重複
- 11. sqoop not import datatype varchar2
- 12. sqoop export performance問題
- 13. Oracle Hadoop Connectors対Sqoop
- 14. Sqoopマージ問題 - Hortonworks
- 15. sqoop import-all-tables fail
- 16. 春XD sqoopジョブの失敗
- 17. Sqoop行の解析エラー
- 18. Sqoopジョブのパスワード発行
- 19. sqoopインポート-すべてのテーブル:
- 20. Sqoopの許可例外
- 21. PythonのSqoopジョブstdout = subprocess.pipe
- 22. SQL ServerへのSqoopエクスポート:スキーマ?
- 23. 分割なしのSqoopインポート
- 24. データ吸入SQOOPを使用
- 25. pythonスクリプトでsqoopを実行
- 26. sqoopインクリメンタルインポートIDを保存
- 27. sqoopインポート--query argumrntを使用
- 28. Sqoop 1.99.6でデータをインポート
- 29. Microsoft Azure HDinsight Ambari SqoopとPostgres
- 30. SqoopインポートNULL文字列