2010-11-29 10 views
1

TwitterフィードからStream Graph DATA SETを作成しようとしています。文字列の値、頻度および時間を格納する文字列のデータセットを作成する

文字列とそのカウントを格納する最も効率的な方法を見つけようとしていますが、周波数を表示する必要があるため、単語の各インスタンスが発生したときに格納する必要があります。

文字列の値、カウント、日付、プルを素早く配列に格納するのに最適なデータベース構造とクエリは何でしょうか?

私が考えているのは、すべてのテキスト値とその日付を格納する1つの大きなテーブルを持つことです。

次に、完全な表の問合せを実行して、すべての行とその数の上位5語を見つけ、別の表に格納します。

次に、完全なテーブルについて別のクエリを実行し、上位5単語のカウントを日付で並べ替えます。

これを改善する方法や、LINQやSQLの簡単なクエリがあれば、大歓迎です。

答えて

1

詳細を知ることなく(これは私がこの上でやってみたい、楽しいと思う)...私は、まず、結果として得られる時系列の尺度をOLAPスキーマ...事実テーブルとディメンションとそのすべてレポートのためのデータモデルは、トランザクションシステムとはまったく異なります。

+0

OLAPをルックアップする必要がありましたが、それは良いアプローチになるようです。私のアプリケーションは一つの解決策ですが、私はここで学びます。 – discorax

関連する問題