2016-06-12 4 views
0

IMAP経由で取得した電子メールメッセージを一度に処理することを実現しようとしています。 (I asked a related question about it.IMAPで取得した電子メールをハッシュで重複排除することはできますか?

IMAP経由で取得したMIMEメッセージの暗号化ハッシュコードを重複排除することは信頼できますか?

つまり、IMAPで何回も検索した場合、同じメールの結果が異なるのはなぜですか?電子メールは、例えばフォルダ間を移動したときや、読んだとしてマーク付けしたときなどの内容を変更することはできますか?

私はhMailserverをWindows上でMailkit.NETをクライアントとして使用しています。しかし、これは問題ではありません。

+0

コンテンツをハッシュしている場合は変更できませんが、実際の重複が存在する可能性があります(メッセージはIMAPでコピーできます)。私はあなたがUIDが十分でなければならないが、問題を工学的に工夫していると思う。 – Max

+0

http://crypto.stackexchange.com/questions/2583/is-it-fair-to-assume-that-sha1-collisions-wont-occur-on-a-set-of-100k-strings/2584 –

答えて

2

多くのメーリングリストにはフッターが追加されているので、2つの異なる署名が付いたリストが届いています。

ほとんどの人はこれを1つのメッセージとみなします。

at-most-once処理にmessage-idヘッダーフィールドを使用することをお勧めします。 AFAICTは、過去10年間(私が見た最後の衝突は2000年頃から)確実にユニークでした。

+0

Itサブジェクトや他のいくつかのヘッダーをチェックして衝突しないようにする価値があるかもしれません(メーリングリストはSubject値に '' [list-name]」をつけることもあります)。 – jstedfast

+0

私はクライアントがまったく送信しないかもしれないと心配していました。 – boot4life

+0

クライアントは、メールが迷惑メールフィルタに惑わされてしまったことを、ずっと前から知っていました。スパム・アサシンには、例えば、メールが悪いか部分的に欠落しているメッセージIDと一致させるための半ダースのルールがあります。 – arnt

関連する問題