2015-11-09 37 views
6

タイトル、コンテンツ、イメージを含むWikipediaのランダムページのセットでJSON結果を取得しようとしています。Wikipedia API - ランダムページを取得

私は彼らのAPIサンドボックスの周りプレイしました、これまでのところ、私が持っている最高のがこれです:

https://en.wikipedia.org/w/api.php?action=query&list=random&format=json&rnnamespace=0&rnlimit=10

しかし、これが唯一の名前空間、ID、および10本のランダムなページのタイトルを含んでいます。私はコンテンツだけでなく画像も取得したいと考えています。

どのように知っていますか?

また、1つのランダムなページのtitle、content、およびimageのURLを使用することもできます。 ベスト私がここに持っている:

https://en.wikipedia.org/w/api.php?action=query&generator=random&format=json

答えて

10

あなたが近いです。 generator=randomは正しい方法です。次に、さまざまなprop値を使用して、必要な情報を取得することができます。

  • ページタイトルは常に含まれています。
  • テキストを取得するにはrvprop=contentと一緒にprop=revisonsを使用してください。
  • ページで使用されているすべての画像を取得するには、prop=imagesを使用してください。

    これには、アイコンやフラグのようなおそらく興味のない画像が含まれることが多いことに注意してください。それを修正するには、代わりにprop=pageimagesを試してみてください。ただし、常に動作するとは思われません。あるいは、両方を使ってみることもできます。

だから、最終的にクエリは次のようになります。

https://en.wikipedia.org/w/api.php?format=json&action=query&generator=random&grnnamespace=0&prop=revisions|images&rvprop=content&grnlimit=10

+0

おかげで多くのことを:) – Petter

関連する問題