1
htmlテーブルを含むMicrosoft Outlookでメールを受信しました。私はこれをpandasのデータフレームに解析したいと思います。html形式のOutlookメールを読む
私はすでに美しいスープを使ってデータフレームにHTMLテキストを解析するスクリプトを書いています。しかし、私は最初にhtmlで電子メールを読むのに苦労しています。
私は以下のコードを使ってメッセージをテキストファイルに読み込んでいます。しかし、それは私が期待していたデータのようなものではなく、/ nで区切られた文字列としてテキストを書いています。つまり、私は美しいスープを使ってこれをデータフレームに入れることはできません。
私は、HTMLメールをどのように書いて、送信するのかの例をたくさん見つけましたが、HTML形式で読む方法はありません。何か案は?
contents = msg.Body.encode('ascii', 'ignore').decode('ascii')
contents_file = open("U:\body.txt", "w")
contents_file.write(contents)
contents_file.close()