私はwikidump pythonライブラリを見つけました。wikidump python libの例や目次をお探しください
私はソースコードを見ることで手に入れることができましたが、私はPythonで新しく、私が必要とするプロジェクトとしてBSコードを書いたくありません。
私は 'wiki-SPECIFICDATE-pages-articles.xml.bz2'ファイルを取得しました。これをシングル記事取得のソースとして使用する必要があります。誰か私にいくつかの文書を指し示しているか、これを正しく達成するための指針を教えてもらえますか?私は何も見つかりませんでした!
私は質問を理解し、しかし、あなたが持っているならば、ウィキペディアはダンプ場合
例として使用できるhttps://github.com/saffsd/wikidump/blob/master/src/wikidump/__init__.pyでコマンドラインクライアントを見てきましたか? – MaxSem
私はhttp://medialab.di.unipi.it/wiki/Wikipedia_Extractorを使ってWikipediaをプレーンテキストに変換します。それは簡単に任意の記事を取得するために変更することができます。 1つの記事の処理をデバッグするだけで、取り込むための正規表現のマッチを挿入する場所がわかります。 – Den