2012-06-27 17 views
13

異種(マルチモード)、マルチエッジタイプ(マルチリレーション)、複数記述機能(マルチフィーチャ)のネットワーク解析のインフラストラクチャを探していますネットワークは、私は、グラフデータベースの世界で2つの標準のスタックがあることに気づいた:一方でグラフデータベース:TinkerPop/BlueprintsとW3Cのリンクデータ

我々はThinkPop/Blueprintproperty graph modelを持っています。それによって支持されているNeo4jOrientDB GraphDBDexTitanInfiniteGraphなど

TinkerpopスタックはBlueprintプロパティグラフモデルインタフェース、Gremlinグラフトラバーサル言語、Furnaceグラフアルゴリズムのパッケージを含みます。我々は等AllegroGraphによって支持されているW3C's Linked Data technology stack4storeOracle Database Semantic TechnologiesOWLIMSYSTap BigData

セマンティックデータをRDF/RDFS/OWLを用いて表現され、そして使用して照会することができる持っている一方

SPARQL上にはrulesreasoningの機能があります。

ここで、異種データをグラフデータベースに表現し、そのようなデータ(統計、関係発見、構造、進化など)を分析したいとします(これらの用語は幅広く曖昧です) - さまざまな種類のネットワーク分析タスクのための各モデルの相対的な強さ?これら2つのモデルはお互いを補完しますか?

答えて

7

リンクされたデータスタックの例は、すべてトリプルストアです。最初にトリプルストアをセットアップすることによって、リンクされたデータアプリケーションを構築し始めますが、データベースをリンクされたデータスタックと呼び出すことは正しくありません。また、不完全なトリプルストアのリストです。Sesame,Jena,MulgaraStardogもあります。 SesameとJenaはセマンティックWeb用の2つのデファクトスタンダードJava APIですが、どちらもAPIにバンドルされたトリプルストアを提供しています。私はまた、CrayとIBMの両方がトリプルストアで作業していることも知っていますが、私はこの時点ではどちらについてもあまりよく分かりません。私はStardogがTinkerPopスタックでうまく動作すること、そして基本的にはRDFに対するGremlinクエリの書き込みを開始していることを知っています。

私はより多くの(自由のため、トリプルストアがそれをサポートしている場合は、推論を取得する)彼らはW3C 基準と3だ)RDF/OWLの強みは、あなたが1)実際のクエリ言語2を得ることだと思いますか少ない - あなたはまだオントロジーを書く必要があります)。

RDF/OWL/SPARQLは標準であるため、必要な場合には別の機能セットを使用して新しいトリプルストアに移動して移動するのが非常に簡単になり、データは誰もが理解できる共通フォーマットになっています。クエリとしてエンコードされたアプリケーションロジックは完全に移植可能です。また、ほとんどの場合、Sesame APIやJena APIのいずれかを書くか、SPARQLプロトコルを使って作業するので、config/initの変更だけが必要な場合があります。初期の試作段階では大きな勝利だと思います。

また、新しいSPARQL 1.1で作成できる複雑なSPARQLクエリの種類と組み合わせた複雑な分析アプリケーションは、複雑な分析アプリケーションを構築するのに適しています。また、ほとんどの人がRDFトリプルストアが拡張できないという印象はもはや正しいとは思えません。この時点では、ほとんどのトリプルストアは数十億のトリプルに容易に拡張され、非常に競争力のあるスループット数を持っています。

あなたがしていると思われることに基づいて、私はsemwebがあなたにとってより良い賭けになるかもしれないと思う。私はRDFS & RDFSをバックエンドに使って同様のプロジェクトを2,3年前に行いました。単純なPylonsベースのWebアプリケーションの前に立ち、結果に非常に満足していました。

関連する問題