2016-04-11 9 views
0

splitの最大サイズを設定する設定項目(max-split-size)があります。つまり、項目の値を変更して分割数を変更することができます。スプリット数の前提ベストプラクティス?

私は知っている、より多くの分割は同時にcpuを使用し、検索はより速くなります。

その場合、なぜアイテムのデフォルト値をprestoに設定するのが1Mではなく32Mであるのですか?

答えて

1

作成された各分割にはオーバーヘッドがあるため、それらの分割が小さすぎることは望ましくありません。また、ORCのようないくつかのファイル形式は、数十から数百メガバイトになる傾向のあるORCストライプのサイズより小さく分割することはできません。