0
split
の最大サイズを設定する設定項目(max-split-size
)があります。つまり、項目の値を変更して分割数を変更することができます。スプリット数の前提ベストプラクティス?
私は知っている、より多くの分割は同時にcpu
を使用し、検索はより速くなります。
その場合、なぜアイテムのデフォルト値をprestoに設定するのが1M
ではなく32M
であるのですか?
split
の最大サイズを設定する設定項目(max-split-size
)があります。つまり、項目の値を変更して分割数を変更することができます。スプリット数の前提ベストプラクティス?
私は知っている、より多くの分割は同時にcpu
を使用し、検索はより速くなります。
その場合、なぜアイテムのデフォルト値をprestoに設定するのが1M
ではなく32M
であるのですか?
作成された各分割にはオーバーヘッドがあるため、それらの分割が小さすぎることは望ましくありません。また、ORCのようないくつかのファイル形式は、数十から数百メガバイトになる傾向のあるORCストライプのサイズより小さく分割することはできません。