2016-11-24 5 views
1

すべてのentity-name-pairをリレーションでダンプします。フリーベースのダンプからのエンティティの関係

例:上記の行で

subject predicate object 
<freebase/ns/g.11bc7__xnw> <freebase/ns/people.place_lived.location> <freebase/ns/m.02_286> . 

Freebaseのは、遊離塩基のウェブサイトのURLを参照します。 サブジェクトとオブジェクトの中間にあるすべてのトリプレットを抽出し、その述語をリレーションとして取り出しました。このように、上記の例の場合

は私のコードが出力されます何か:

entity pair : g.11bc7__xnw , m.02_286 
relation : people.place_lived.location 

私は2つの問題を抱えている:私は遊離塩基ダンプ私は14887人の関係を得たが、実際の数に私のコードを実行した

  1. 25,000以上の関係があります。
  2. 一部の中には、プロパティ名やエイリアスがありません。 (/type/object/name, /common/topic/alias

私が間違っていることを教えてください。

+0

例: \t \t \t。 –

答えて

0

まあ、いくつかの関係は半ばに、基本的な値を指していします

<http://rdf.freebase.com/ns/g.11vjz1ynm> <http://rdf.freebase.com/ns/measurement_unit.dated_percentage.date> "2001-02"

そして、それは基本的に全体measurement_unitドメインです。

次に、複雑な関係を保持する人工ノードであるcvt(複合値型)のような名前とエイリアスの音がないミッド(ノードからノード+時間)。

だから、私はあなたが測定値、ブール値、日付などとcvtsの方が良いと思う。

+0

返信いただきありがとうございます。 私の仕事のために、私はこれらのタイプの複合値型を望んでいません。 –

関連する問題