2016-09-11 13 views
6

Wikidata(Wikidata SPARQL endpoint)では、PageRankのようなものでSPARQLクエリの結果を注文する方法はありますか?Wikidataの結果はPageRankのようなものでソートされています

SELECT DISTINCT ?entity ?entityLabel WHERE { 
    ?entity wdt:P31 wd:Q5. 
    SERVICE wikibase:label { 
    bd:serviceParam wikibase:language "en" . 
    } 
} LIMIT 100 OFFSET 0 

私たちは、結果を注文するフィールドを指定すると、そのフィールドは、最上部の実体は、次の1というというように認識/重要な/もっと注目すべきであることを表現することはできますか?

+0

ここに同様の質問を? http://stackoverflow.com/questions/39040060/sparql-select-the-most-relevant-category-of-a-dbpedia-resource –

+0

この質問には、DBpediaに関連するものとまったく同じものがありますが、私のものはWididataに関連しています。 DBpediaにはこの "ページランク" http://people.aifb.kitがあります。edu/ath /#DBpedia_PageRankが組み込まれており、関連性によって結果を並べ替えるのに役立ちます。私の質問は、Wikidataも私が使用できる同等のランクを持っている場合です。 – jordipala

答えて

2

PageRankはWikidataに関してはあまり意味がないようです。明らかに、大きなクラスと大きな集計がリーダーになります。

また、Webリンクとは異なり、RDF述語は両側から「ナビゲート可能」です。 URIは対象であり、どのURIがオブジェクトであるかは単なる設計上の問題です。

しかし、Andreas Thalhammer continues彼の作品。トップ10ウィキデータエンティティは以下のとおりです。残念ながら、DBpediaののページランクとは異なり、ウィキデータのページランクがエンドポイントで公開されていない

Q729 animal  24996.77 
Q30  USA   24772.45 
Q1360 Arthropoda 16930.883 
Q1390 insects  16531.822 
Q35409 family  14403.091 
Q756 plant  14019.927 
Q142 France  13723.484 
Q34740 genus  13718.484 
Q16  Canada  12321.178 
Q159 Russia  11707.16 

、一つはSPARQLを使用してそれらを照会することはできません。


幸いなことに、自分自身に何らかの種類のランクを付けることができます。可能なオプションは以下のとおりです。出てきた文の

  1. precalculated)。
  2. サイトリンクの数precalculated);
  3. 受信文の数(以下の例では、truthy文のみがカウントされます)。

例クエリ:

SELECT ?item ?itemLabel ?outcoming ?sitelinks ?incoming { 
    ?item wdt:P31 wd:Q185441 . 
    ?item wikibase:statements ?outcoming . 
    ?item wikibase:sitelinks ?sitelinks . 
     { 
     SELECT (count(?s) AS ?incoming) ?item WHERE { 
      ?item wdt:P31 wd:Q185441 . 
      ?s ?p ?item . 
      [] wikibase:directClaim ?p 
     } GROUP BY ?item 
    } 
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }. 
} ORDER BY DESC (?incoming) 

Try it!

すべてのこれらの指標は、多かれ少なかれ相関しています。ここでは、以下の

scatterplot matrix

EU加盟国のためにこれらの措置の相関係数です。

Pearson 
------- 
      outcoming sitelinks incoming pagerank  
outcoming 1.0000 0.6907 0.7416 0.8652 
sitelinks 0.6907 1.0000 0.4314 0.5717 
incoming  0.7416 0.4314 1.0000 0.8978 
pagerank  0.8652 0.5717 0.8978 1.0000 


Spearman 
-------- 
      outcoming sitelinks incoming pagerank 
outcoming 1.0000 0.6869 0.7619 0.8736 
sitelinks 0.6869 1.0000 0.7680 0.8342 
incoming  0.7619 0.7680 1.0000 0.8872 
pagerank  0.8736 0.8342 0.8872 1.0000 


Kendall 
------- 
      outcoming sitelinks incoming pagerank 
outcoming 1.0000 0.4914 0.5661 0.7143 
sitelinks 0.4914 1.0000 0.5764 0.6454 
incoming  0.5661 0.5764 1.0000 0.7249 
pagerank  0.7143 0.6454 0.7249 1.0000 

も参照してください:

関連する問題