1
pptx
文書内の単語を数える関数を作成しようとしています。問題は、私は、タグの唯一のこの種を見つける方法を見つけ出すことができないということです。SyntaxError:プレフィックス 'a'がプレフィックスマップに見つかりません
<a:t>Some Text</a:t>
私がしようとすると:print xmlTree.findall('.//a:t')
、それは
SyntaxError: prefix 'a' not found in prefix map
を返し、あなたが何をすべきか知っていますかそれを動作させるには?
これは、関数である:
def get_pptx_word_count(filename):
import xml.etree.ElementTree as ET
import zipfile
z = zipfile.ZipFile(filename)
i=0
wordcount = 0
while True:
i+=1
slidename = 'slide{}.xml'.format(i)
try:
slide = z.read("ppt/slides/{}".format(slidename))
except KeyError:
break
xmlTree = ET.fromstring(slide)
for elem in xmlTree.iter():
if elem.tag=='a:t':
#text = elem.getText
#num = len(text.split(' '))
#wordcount+=num
[ 'ElementTreeの' を介して、Pythonでの名前空間とXMLを解析]の可能複製(http://stackoverflow.com/質問/ 14853243/parsing-xml-with-namespace-in-python-via-elementtree) – dsh