2016-04-25 6 views
0

Wikipediaの特定の記事の時間枠内で追加または削除されたすべてのWikipediaリンクを抽出する方法を知りたいと思います。Wikipedia:リンクはいつ追加されましたか?

は、これまでのところ、私はこの質問にウィキペディアのリビジョンを抽出する方法を知っている:How to get full Wikipedia revision-history list from some article? 、特定の時間ウィンドウのためにそれを行う方法:たとえばAPI to get Wikipedia revision id by date

、ここで私はのための改訂の内容を取得する方法をされて記事の時間窓Germanwings_Flight_9525: https://en.wikipedia.org/w/api.php?action=query&format=xml&prop=revisions&rvlimit=500&titles=Germanwings_Flight_9525&rvstart=20150325180000&rvend=20150323180000&rvprop=ids|timestamp|content

リンクの追加と削除の方法は?

おかげ

+0

これまでに作業したコードスニペットをご提供ください。 –

+0

私はまだコードを作っていない、私はリンクを取得する簡単な解決策があるかどうかを確認しようとしている(余りに多くの正規表現コードなし)。 –

+0

いくつかの種類のWikipediaリンクがあるので、* 'link' *の例を教えてください – Termininja

答えて

0

あなたはすべてのリビジョンを取得することができ、「[[」と次を探してそれらを分割します「|」または "]"文字。これを使うと、すべてのリンクを見つけることができます。リンクは新しいリストを認識するためにリストなどで収集することができます。

関連する問題