sqoopにはいくつのデフォルトマッパーと減速機がありますか? (4マッパー、0レデューサー)。減速機の数はsqoopで
--where
または--query
の条件をsqoop import
に使用すると、そこにはいくつのレデューサーが含まれますか?
ローカルクラスタでは、sqoopあたりユーザーガイドとして、ほとんどのデータベース・ソースから並列にSqoopインポートデータを--where or --query condition
sqoopにはいくつのデフォルトマッパーと減速機がありますか? (4マッパー、0レデューサー)。減速機の数はsqoopで
--where
または--query
の条件をsqoop import
に使用すると、そこにはいくつのレデューサーが含まれますか?
ローカルクラスタでは、sqoopあたりユーザーガイドとして、ほとんどのデータベース・ソースから並列にSqoopインポートデータを--where or --query condition
を使用した後0
減速を示しています。 --num-mappers
引数を使用して、インポートを実行するために使用するマップタスク(並列プロセス)の数を指定できます。デフォルトでは、4つのタスクが使用されます。あたかも集約タスクを実行していないかのように、減速タスクはゼロになります。詳細についてはhttp://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_free_form_query_imports
Sqoopジョブはマップです。レデューサー段階はありません。
たとえば、4つのマッパーを使用してMysqlからHDFSにsqoopをインポートすると、4つの同時接続が生成され、データの取得が開始されます。 4マッパージョブが作成されます。データはHDFSパーツファイルに書き込まれます。減速ステージはありません。
マップ出力はディスク上でローカルになるため、データはどのように減速器なしでhdfsに移動されますか? –