2011-12-13 14 views
2


弾性大容量ストレージのマルチノード
コンピュータネットワーク(Linux PCの内部サブネット)にまたがるB +ツリーを構築したいと考えています。レンジスキャンは重要です。分散ネットワークB +ツリー

これは基本的に
分散型DBシステムの基礎となるデータ構造ですか? (Cassandra、HBase)

配布されたB +ツリーについての研究はありますか?
私は
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
で記事を見ましたが、のbtreeだけで故障したノードを取り出し(そのデータの損失があります)スキップ

私は(つまり、もし内蔵の冗長性
とB +木で特に興味ホストに障害が発生し、すべてのノード、それのホストが、私は別の複製されたホストが
サーバープライマリノードになり、失敗したホストの場所を取るしたいのですが、
オフラインになっている)

私は、コレクションを使用したくありませんのDBインシャーシとしての
(1ノード、1つのDB)は、大規模に拡張されたストレージシステム(
x86、x64ハードウェアとFOSS OSを介して)の場合、
には適していません。

私は車輪を再発明していますか?
私はCassandraまたはHBaseを使うべきですか?

答えて

2

カサンドラは範囲クエリをサポートしています。

GoogleのBig Tableは、マシンをオンにすると自動的に新しいマシンをクラスタに追加します。非常に弾力性があり、より多くの機械を追加するのは簡単です。残念ながら、その速度には欠点があります。クエリは非常に制限的です。いくつかの範囲照会を行うことができます。データはビッグ表に格納する方法http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

すばらしい例:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

素敵なスタックオーバーフローポスト: storing massive ordered time series data in bigtable derivatives

一覧と詳細はこちらの記事を参照してください