2017-02-26 2 views
1

Pythonを使用してDBpediaデータ・ダンプからエンティティに関する情報を取得するにはどうすればよいですか?それによってDBpediaファイルダンプをクエリするには?

単に反復するエンドポイントでの作業とデータ・ダンプ・ファイル(のようなhttps://datascience.stackexchange.com/questions/4873/querying-dbpedia-from-python)をwuthないことで作業のscikit-学ぶの実装のSPARQL Endpoint interface to Python

Oneを使用している現在のstackoverflow上のポストのほとんどは、それらを置きます

たとえば、ある特定の日付に生まれた有名人については、info-box data dumpsのプロパティから探したいと思っています。

私はSPARQLエンドポイントインターフェイスを使って同じことを試みましたが、明らかにデータダンプでは機能しませんでした。

+1

パブリックSPARQLエンドポイントが利用可能な場合に、なぜデータ・ダンプを処理する必要がありますか? - あなたがそれをしたいと思う理由があるかもしれませんし、それを理解することは良いでしょう(答える前に)。 – CaptSolo

答えて

1

通常、このデータをRDFストアにロードします(まだ持っていない場合はインストールします)。そして、SPARQLを使用してクエリを実行します。

これを実行すると、ローカルDBPediaミラーが作成されます。 DBPediaが既にSPARQLエンドポイントを提供していることを考慮すると、単にそれを使用できない理由がありますか?

このStackOverflowの答えはローカルDBpediaのミラーをセットアップするためにあなたが持っているオプションを言及:このWhy dbpedia result is not consistant

なしには、Python固有ではありません - SPARQLは、RDFデータのための標準的なクエリ言語です。

また、オンザフライで必要な情報を探してファイルを繰り返し処理することもできます。この方法で柔軟性が失われます(「クエリ」はあなたのコードです)が、メモリ使用量を節約することができます。

+0

入力いただきありがとうございます。ダンプのような特定のデータセットのように、より具体的なエンドポイントをどこに見つけることができますか? – TJain

+1

より具体的なエンドポイントは必要ありません。標準エンドポイント(例:http://live.dbpedia.org/sparql)には、あなたが言及したインフォボックスデータセットを含む多くのDBPediaデータファイルのデータが含まれています。 – CaptSolo

関連する問題