1
xmlファイルから<title>
,<title_id>
のようなタグ値を読みたいと思います。 <title>
の値が正常に読み取られました。同じループで<title>
,<title_id>
を読むことはできますか?
私はXMLを初めて使いました。XMLファイルタグを読む
<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.5/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.5/ http://www.mediawiki.org/xml/export-0.5.xsd" version="0.5" xml:lang="en">
<siteinfo>
<sitename>Wiki</sitename>
<case>first-letter</case>
<namespaces>
<namespace key="0" case="first-letter" />
</namespaces>
</siteinfo>
<page>
<title>Sex</title>
<title_id>31239628</title_id>
<revision>
<id>437708703</id>
<timestamp>2011-07-04T13:53:52Z</timestamp>
<text xml:space="preserve" bytes="6830">{{ Hello}}
</text>
</revision>
</page>
</mediawiki>
私はファイルからすべてのタイトルを読み取るために次のコードを使用しています。そして、それはうまく動作します。
import xml.etree.cElementTree as etree
tree = etree.parse('find_title.xml')
for value in tree.getiterator(tag='title'):
print value.text
はい、これは少し行き過ぎです。しかし、複数の名前空間と重複するタグ名を持つドキュメントにアクセスするときに、名前空間を使用する方法を知っておくとよいでしょう。 – MattH
提案していただきありがとうございます。 1つの結果しか表示されません。私が複数の '' –