2016-10-10 13 views
1

htmlテーブルを含むMicrosoft Outlookでメールを受信しました。私はこれをpandasのデータフレームに解析したいと思います。html形式のOutlookメールを読む

私はすでに美しいスープを使ってデータフレームにHTMLテキストを解析するスクリプトを書いています。しかし、私は最初にhtmlで電子メールを読むのに苦労しています。

私は以下のコードを使ってメッセージをテキストファイルに読み込んでいます。しかし、それは私が期待していたデータのようなものではなく、/ nで区切られた文字列としてテキストを書いています。つまり、私は美しいスープを使ってこれをデータフレームに入れることはできません。

私は、HTMLメールをどのように書いて、送信するのかの例をたくさん見つけましたが、HTML形式で読む方法はありません。何か案は?

contents = msg.Body.encode('ascii', 'ignore').decode('ascii') 
contents_file = open("U:\body.txt", "w") 
contents_file.write(contents)    
contents_file.close() 

答えて

2

自分自身で回答が見つかりました。 msg.Bodyではなくmsg.HTMLBodyを使用する必要があります