2009-03-30 6 views
1

私は電子メールで引用されたテキストを識別する方法を探しています。目標はGmailハンドヘルドの "引用されたテキストを表示する"機能を、メールハンドラボットを含む私のWebアプリケーションに追加することです。電子メール内の引用されたテキストを識別する既存のツールまたはコード

stackoverflowに関する同様の質問がありますが、アルゴリズムを要求しています。私がする必要があればこれを実装することができますが、私は大いに試して真の解決策を好むでしょう。

要件:;推測する必要はありません

1)HTMLとプレーンテキストのメール

2の両方をサポートしていますが)、それが引用されたテキストに対して比較するために、元のテキストを持っている、つまり(フルスレッドで動作します

Pythonライブラリは、超魔法の素晴らしい理想的であるが、私は期待しないでください。)

3)は、「5月10日、2008年18:35にブランドンが書いた」などの一般的な引用関係の追加を処理しますそれを幸運にする。これを行うことができる簡単なコマンドラインツールは理想に近いでしょうが、私はそれも幸運であるとは思いません。私は喜んでツールに抽出することが合理的に可能なオープンソースのメールクライアントからよく知られている良い実装に決めるだろう。

私の最善の策は誰にでもありますか?

「電子メールハンドラボット構築キット」はありません。

答えて

2

私はこの質問に関するメールを受け取ったばかりです。

Supには、これを達成するためのかなりわかりやすい/抽出/翻訳ビットがあります。関連する関数をPythonに移植し、私の目的のためにそれを微調整しました。

燮はRubyで書かれた端末ベースのメールクライアントである:http://sup.rubyforge.org/

+0

あなたはあなたのポートを公開するために起こりましたか。 – pfctdayelise

+2

http://gist.github.com/504232 –

+0

利用可能:https://github.com/github/email_reply_parser –

関連する問題