0
私の問題は、500k行のOracleテーブルがあることです。私はそれを寄木張りファイルとしてHDFSにインポートするようにsqoopを設定しました。私は--num-partitionパラメータを32に設定しました.32個のパーケットファイルを取得しましたが、そのうちの1つは28 MB、それ以外は2-3 KBです。ここでsqoopインポートの寄木細工のサイズ
は私のsqoopコマンドです:
bin/sqoop import --connect <JDBC> --username <USER> --password <PASSWD> --table <TABLE> --target-dir <TARGET_DIR> -m32 --as-parquetfile --delete-target-dir --outdir <DIR>
私の質問は、このファイルサイズの理由何ができるか、ですか?