私はデータを扱うためのベストプラクティスを探しています。ですから、それは私がこれまでに得たものです:タイプ "A"の1.000.000個のノード。すべての「A」ノードは、タイプ「B」の1-1000ノードとタイプ「C」の1-10ノードに接続することができます。大きなデータセットを扱う(neo4j、mongo db、hadoop)
私はneo4jグラフにデータをインポートするためのRESTfulサービス(Java、Jersey)を作成しました。ノード "A"(唯一のノード、ids、さらなるデータなし)のインポート後、私はneo4j dbが〜2.4GBまで成長したことに気付きました。
neo4jに追加のフィールド(名前、説明、...)を格納することをお勧めしますか?または、データアクセスにキー/値の組み合わせを使用するmongoDB/hadoopを設定する必要がありますか?
私の意見では、100万ノード/数GBでハイドープに行くことを保証するには不十分です。 –