私はamazon athenaに問題があります。私は小さなバケット(36430個のオブジェクト、9.7メガバイト)に4レベルのパーティション(my-bucket/p1 = ab/p2 = CD/P3 = EF/P4 = GH/file.csvになり)が、私は、コマンドを実行するとAWS Athena MSCK REPAIR TABLEは小さなデータセットでは長すぎます
MSCK REPAIR TABLE db.table
は25分以上を取っている、と私はアテナにTBの大きさのデータを配置する計画を持っていますこの問題が残っていれば私はそれをしません
誰がなぜ時間がかかりすぎるのか分かりませんか?それは、ファイルシステム(S3バケット)にテーブルのサブツリーをスキャンする必要があるため、事前に
おかげ