2009-03-31 16 views
0

WikipediaのXMLダンプをダウンロードした場合、XMLファイル内からすべての内部リンクを削除する方法はありますか?それらの使用に関するWikipediaのXMLファイルから内部リンクを削除するには?

おかげ

+0

ありがとうございました。 –

+0

好奇心の中でどの方法を解決しましたか? –

+0

残念ながら、[[Wikipediaの特別なフォーマットのためには機能しません。私はまだボットに自信がないので、私はそれをするために誰かに払うことができるまで、それは現時点では保留です!だから、方法はありません!みんな助けてくれてありがとう、とても便利。 –

答えて

0

ローカルWikiにインポートする場合は、必要なファイルをすべてインポートしてから、ロボット(例:pywikipediabot)を使用してすべての内部リンクを削除します。

+0

さらに、あなたのインターネットアクセスがあるどこかであなたのwikiが使用されるならば、あなたは[[wikipedia:PageName | PageName]]への内部リンクをすべて変更して元の記事を参照することができます。 –

0

ウィキペディアデータベースダンプと情報はここにあります:Wikipedia:Database download。 Wikipediaを掻き取るためのスクリプトを書くのではなく、これを行うべきです。

+0

ええ、本当に間違って私の質問を得たことがわかった! xmlファイルから内部リンクを削除するにはどうすればよいですか? –

-1

好きなテキストエディタで[[と]]を何も置き換えずに検索して置き換えることができます。

0

XMLファイルを別のXMLファイルに変換するためにXSLTを使用しようとします。

関連する問題