2012-02-01 11 views
2

のNoSQL、HBaseの、カサンドラ概念化デシベル

Student , College. 

学生属性、たとえば私は、Nとの関係1を持っていると仮定します。

Name,Surname,CollegeFKey, 

・カレッジ属性:

CollegeKey,Other,Other. 

と仮定私は学生と試験をプレーンテキストファイルから読むプログラムを持っています。そして、このファイルに私は大学と重複したスタッドを複製しました。非正規化テーブルのよう

例えば
CollegeId,Other,Other,Name,Surname,CollegeFkey. 

あなたが見

1,x,y,Mike,M,1 
1,x,y,R,P,1 
... 
... 
... 

、私は私の正規化されたデシベルで、私はまだ表の大学に挿入されていないことを、常にこのような場合には2回私はHBaseの中でこの問題を解決するにはどうすればよいのキー1.

をチェックする必要がまたはカサンドラ?私は10000 ..テーブルと行を持っている場合、私はすべての主キーを確認する必要はありませんし、すべてのFKのためにそれがOKを挿入された場合は?

どうすれば解決できますか?私は非正規化されたデータで直接仕事のためにSQLデータベースdbを使用することはできますか? この問題を解決する例に私をリンクできますか?

+0

いくつかのhbaseユーザーと話をすると、答えは "hadoop:definitive guide"という本で見つけることができます。実際には、この種の問題に対してSQLラーニングクエリを実行するにはPig Latinを使用します。これが助けてくれるといいなあ私はまだそれほど多くのことを経験していないと思うので、私はユーザーがそれについてコメントしてくれることを願っています。 - user448381 2時間前 –

答えて

0

Cassandra http://wiki.apache.org/cassandra/を高級言語のクライアントで使用できます(私はHector for java https://github.com/rantav/hectorを使用しています)。カッサンドラでは、このColumnFamilyのColumnFamily Collegeについて説明します。あなたは学生に関する情報を含むStudentカラムを書いています。