2

すべて、シーケンス集約

は、私は、グラフデータベース領域に新しいですし、グラフデータベースに該当する場合場合など、このタイプのを知ってほしいです。

私は野球の試合を見ています。各プレイヤーがバットに行くと、ヒット、ストライクアウト、またはウォーキングの3つの可能な結果があります。

野球シーズン中の各バッターについて、私が把握したいのは、シーケンスの数です。

たとえば、プレートにn回移動した打者の場合、特定のシーケンス(ヒット/ウォーク/打撃またはヒット/ヒット/ヒット/ヒット)を持っていた人の数、同じ打者は同じシーケンスを時間で索引付けしました。さらに説明すると、特定のシーケンス(ヒット/ウォーク/ストライクアウト、ヒット/ヒット/ヒット/ヒット)が、シーズンの開始時、中期、または後半に発生したかどうかを知ることができます。キーと値の型データベースの場合

次のように、生データは、になります。したがって

Batter  Time  Game Event  Bat 
-------  -----  ---- --------- --- 
Charles  April  1  Hit   1 
Charles  April  1  strikeout 2 
Charles  April  1  Walk  3 
Doug  April  1  Walk  1 
Doug  April  1  Hit   2 
Doug  April  1  strikeout 3 
Charles  April  2  strikeout 1 
Charles  April  2  strikeout 2 
Doug  May   5  Hit   1 
Doug  May   5  Hit   2 
Doug  May   5  Hit   3 
Doug  May   5  Hit   4 

を次のように、私の出力が表示されます:

Sequence     Freq  Unique Batters Time 
-----------------------  ----  -------------- ------ 
hit       5000  600    April 
walk/strikeout    3000  350    April 
strikeout/strikeout/hit  2000  175    April 
hit/hit/hit/hit/hit   1000  80    April 
hit       6000  800    May 
walk/strikeout    3500  425    May 
strikeout/strikeout/hit  2750  225    May 
hit/hit/hit/hit/hit   1250  120    May 
.       .   .    . 
.       .   .    . 
.       .   .    . 
.       .   .    . 

これはグラフの実現可能である場合データベース、それもスケールするだろうか?バッターにとって3つの可能なアウトカムの代わりに、10,000,000バターの可能性のあるアウトカムが10,000の場合はどうでしょうか?

これ以上のように、コンビナトリアル設定(例えば10,000選択2、10,000選択3など)で10,000のユニークな結果が配列される。

私の質問は、グラフ化データベースが適切であれば、ソリューションの設定をどのように提案しますか?

事前に感謝します。

答えて

0

私は、あなたの例としてグラフデータベースを使用することに利点はありません。グラフ人間のネットワークのような関連性の高いデータに関しては、データベースは良いです。グラフのトラバーサルは非常に効率的です。 リレーショナルデータベースは、あなたのニーズに非常によく合っているはずです。