すべて、シーケンス集約
は、私は、グラフデータベース領域に新しいですし、グラフデータベースに該当する場合場合など、このタイプのを知ってほしいです。
私は野球の試合を見ています。各プレイヤーがバットに行くと、ヒット、ストライクアウト、またはウォーキングの3つの可能な結果があります。
野球シーズン中の各バッターについて、私が把握したいのは、シーケンスの数です。
たとえば、プレートにn回移動した打者の場合、特定のシーケンス(ヒット/ウォーク/打撃またはヒット/ヒット/ヒット/ヒット)を持っていた人の数、同じ打者は同じシーケンスを時間で索引付けしました。さらに説明すると、特定のシーケンス(ヒット/ウォーク/ストライクアウト、ヒット/ヒット/ヒット/ヒット)が、シーズンの開始時、中期、または後半に発生したかどうかを知ることができます。キーと値の型データベースの場合
次のように、生データは、になります。したがって
Batter Time Game Event Bat
------- ----- ---- --------- ---
Charles April 1 Hit 1
Charles April 1 strikeout 2
Charles April 1 Walk 3
Doug April 1 Walk 1
Doug April 1 Hit 2
Doug April 1 strikeout 3
Charles April 2 strikeout 1
Charles April 2 strikeout 2
Doug May 5 Hit 1
Doug May 5 Hit 2
Doug May 5 Hit 3
Doug May 5 Hit 4
を次のように、私の出力が表示されます:
Sequence Freq Unique Batters Time
----------------------- ---- -------------- ------
hit 5000 600 April
walk/strikeout 3000 350 April
strikeout/strikeout/hit 2000 175 April
hit/hit/hit/hit/hit 1000 80 April
hit 6000 800 May
walk/strikeout 3500 425 May
strikeout/strikeout/hit 2750 225 May
hit/hit/hit/hit/hit 1250 120 May
. . . .
. . . .
. . . .
. . . .
これはグラフの実現可能である場合データベース、それもスケールするだろうか?バッターにとって3つの可能なアウトカムの代わりに、10,000,000バターの可能性のあるアウトカムが10,000の場合はどうでしょうか?
これ以上のように、コンビナトリアル設定(例えば10,000選択2、10,000選択3など)で10,000のユニークな結果が配列される。
私の質問は、グラフ化データベースが適切であれば、ソリューションの設定をどのように提案しますか?
事前に感謝します。