2016-06-01 3 views

答えて

2

新しいフォーマットでは、多くの場合、標準のlibsを使用してxmlを解凍して解析することができます。ドキュメント作成者を取得するコードは、以前はposted as an answer on stackoverflowでした。

import zipfile, lxml.etree 

# open zipfile 
zf = zipfile.ZipFile('my_doc.docx') 
# use lxml to parse the xml file we are interested in 
doc = lxml.etree.fromstring(zf.read('docProps/core.xml')) 
# retrieve creator 
ns={'dc': 'http://purl.org/dc/elements/1.1/'} 
creator = doc.xpath('//dc:creator', namespaces=ns)[0].text 

古い形式の場合、あなたはhachoir-metadata library

で見たいと思うかもしれません
関連する問題