0
私はapacheドリルを使ってデータフォーマット変更プログラムを作った。このプログラムで圧縮された寄木細工のファイルを作成するためのクエリ方法は?
、csvファイルをJSONに変換する場合は、JSONファイルHDFS
で行われた。しかし、私は、出力ファイルにしたいが圧縮されます。
可能でしょうか?それを作る方法があれば??
私はapacheドリルを使ってデータフォーマット変更プログラムを作った。このプログラムで圧縮された寄木細工のファイルを作成するためのクエリ方法は?
、csvファイルをJSONに変換する場合は、JSONファイルHDFS
で行われた。しかし、私は、出力ファイルにしたいが圧縮されます。
可能でしょうか?それを作る方法があれば??
はい、Apacheのドリルで圧縮タイプを設定できます。ドキュメントから
、
あなたは、システムまたはセッションレベルでは、クラスタごとにドリルクエリの計画と実行のオプションを設定することができます。セッション・レベルで設定されたオプションは、現行のドリル接続中に実行する照会にのみ適用されます。システムレベルで設定されたオプションは、システム全体に影響を及ぼし、再起動の間も持続します。セッション・レベルの設定をオーバーライドシステム・レベルの設定「
ALTER SYSTEM SET `option_name` = value;
オプション名store.parquet.compressionあなたは許容値から圧縮タイプを選択できます。てきぱきと、GZIP、どれも
詳細情報here。
パフォーマンスの時間を増やさない場合、出力データサイズが以前よりも小さい場合、あらゆる方法で問題ありません。 – jjj111144444