2012-05-05 9 views
3

データは、例えばCSVファイルやHTMLの<table>要素で「テーブル」として頻繁に送信されますが、これらは類似している可能性がありますが、異なる暗黙の構造を持つことがあります。例えば:データのパターンはありますか?

Height(cm) Weight (kg) 
Pat 180  70 
Sue 160  40 
Jo  164  50 

は均質データ列方向を有する矩形の表に、オブジェクトの順序なしリスト(属性の身長と体重を持つ人)として解釈することができます。

これに対して、これは長方形のテーブルではありませんが、1つのように見えます。

Dist(m)/Time(m)  Hull Leeds London 
Hull     0.0 69 229 
Leeds     59 0.0 218 
London     186 201 0.0 

それは実際に英国の都市間の二つの関連三角行列(距離や移動時間)の誤字組成物です。

データパターン(コードパターンがあるように)がありますか?他の例としては、TimeSeries、CorrelationMatrices、Histogramsなどがあります。これらが宣言されているか経験的に発見可能であっても、読み込みと分析がはるかに容易になります。

更新日: @Kathiravelと@Jordãoの両方が、より広い(そして貴重な視点)を与えました。私の最初の質問は、コンピュータプログラムやデータベースを参照することなく、無意識のうちにデータに関するものでした。どのようなタイプの暗黙的なデータ構造/パターンが、抽象的な構造が著しく異なるコード/データベースの外部で共通に使用されているかということを尋ねようとしていましたか?

@ Kathiravelのポインタは、主にデータを管理するプロセスです。これは便利です。

+0

なぜdownvoteですか?データの形がわからない場合は、コードを書くことはできません。 SOの範囲に見える –

答えて

3

右を検索することは、設計で使用するデザインパターンを見つけることと同じくらい重要です。データへのアクセスや保存の方法に応じて、フラットリストからクアッドツリーまで、無数のデータ構造があります。あなたのアルゴリズムの性能と保守性に大きな違いをもたらす可能性があります。

データ構造の良いリストon Wikipediaがあります。最初のテーブルは(リレーショナルテーブルのような)構造化されたデータの単純なリストを表しているように見えます。そして、2番目の例はグラフを表すために使用されるadjacency matrixによく似ています。

さらに、データベースに関連するいくつかのポインタについては、this answerをご覧ください。

+0

+1ありがとうございます。あなたのポイントは貴重です。私は無意識のうちにコード内の実装外のデータに集中し、その問題を修正します。 –

1

データパターンが存在します。したがって、データマイニングおよびパターン認識技術は、所与のデータのパターンを見つける際に存在する。

http://msdn.microsoft.com/en-us/library/ff648420.aspxは、もはや維持されませんが、データパターンに関する情報を提供します。

+0

+1 - これは全体の画像の一部です。それは構造よりむしろプロセスに集中しているようですが、それは確かに重要です。 –

関連する問題