2016-12-19 62 views
6

私は、いくつかの圧縮CSVファイル(利用ログ)を持つS3バケットを持っています。このデータをAthenaで照会したいと思いますが、出力が完全に文字化けしています。Amazon Athenaと圧縮S3ファイル

アテナは、まず圧縮解除せずにzipファイルを解析しようとしているようです。 Hiveに自分のファイルを圧縮されたデータとして認識させることは可能ですか?アテナ圧縮用

答えて

12

支持されているが、サポートされるフォーマットは

  • あるスナッピー(.snappy)
  • Zlibの(.bz2)
  • GZIP(.gzという)

これらの形式ファイル名の接尾辞で検出されます。接尾辞が一致しない場合、リーダーはコンテンツをデコードしません。 test.csv.gzファイルでテストしましたが、すぐに動作しました。圧縮をzipからgzipに変更してみるとうまくいくはずです。

+0

ありがとうございました。私はこれが答えかもしれないと恐れていた。私はこのバケツの形式を制御することができません、プログラムで解凍して別の場所に保存するようにジョブをスケジュールする必要があります。 – MattY

関連する問題