2009-07-24 8 views
5

チャンクデータセットに関するHDF5のパフォーマンスを評価しています。 特に、連続した異なるチャンクを読み込むことが可能かどうか、パフォーマンスがその影響をどのように受けているかを把握しようとしていますか? など。チャンクサイズが10のデータセット、100の値を持つデータセットがあり、23〜48の値を読み取る必要があります。パフォーマンスが大幅に低下しますか?チャンクされたHDF5データセットとスラブサイズ

多くの感謝!

答えて

3

あなたの質問に具体的に答える方法はわかりませんが、1024のチャンクサイズ(またはそれ以上の2の累乗)を使用することをお勧めします。私はHDF5の内部を知りませんが、ファイルシステムに関する私の知識と私たちが行った大まかなベンチマークから、1024は正しいものでした。

+0

お返事ありがとうございます!私はすでに、チャンクサイズ自体が重要なパフォーマンス要素であることを観察しました。あなたが言及したように、> 1000のチャンクサイズは良い出発点です。私が理解しようとしているのは、異なるチャンクから連続したデータを読み取るときにパフォーマンスにどのような影響があるかです。しかし、私はこれが具体的に答えることができない質問であることを恐れています。そこで、いくつかのベンチマークを実行する必要があります。 – usac

関連する問題