私は電子メールで引用されたテキストを識別する方法を探しています。目標はGmailハンドヘルドの "引用されたテキストを表示する"機能を、メールハンドラボットを含む私のWebアプリケーションに追加することです。電子メール内の引用されたテキストを識別する既存のツールまたはコード
stackoverflowに関する同様の質問がありますが、アルゴリズムを要求しています。私がする必要があればこれを実装することができますが、私は大いに試して真の解決策を好むでしょう。
要件:;推測する必要はありません
1)HTMLとプレーンテキストのメール
2の両方をサポートしていますが)、それが引用されたテキストに対して比較するために、元のテキストを持っている、つまり(フルスレッドで動作します
Pythonライブラリは、超魔法の素晴らしい理想的であるが、私は期待しないでください。)
3)は、「5月10日、2008年18:35にブランドンが書いた」などの一般的な引用関係の追加を処理しますそれを幸運にする。これを行うことができる簡単なコマンドラインツールは理想に近いでしょうが、私はそれも幸運であるとは思いません。私は喜んでツールに抽出することが合理的に可能なオープンソースのメールクライアントからよく知られている良い実装に決めるだろう。
私の最善の策は誰にでもありますか?
「電子メールハンドラボット構築キット」はありません。
あなたはあなたのポートを公開するために起こりましたか。 – pfctdayelise
http://gist.github.com/504232 –
利用可能:https://github.com/github/email_reply_parser –