私が理解するところでは、Regexは特定のドキュメント内の電子メールをスキャンするときに使用するのに最適なものではありません。これに代わる方法があるのだろうか?または私が気づいていないベストプラクティスの方法?Ruby - テキストまたはHTMLからの電子メールの解析
答えて
構文解析ジョブでは、ライブラリを信頼することをお勧めします。あなたは電子メールを解析するための一つのRubyライブラリはMailある
など、ライブラリは常に異なるケースを考慮して、正規表現よりも詳細に問題を扱っていますが、正しいです:メールは、インターネットでメールを扱うように設計されたRubyのライブラリ 世代、の構文解析と簡単なrubesqueの方法で送信します。
[...]メールはあなたが何をしているか知っている 場合、あなたはあなたのすべての最後のビットをいじることができ、本当にあなたが解析している電子メールメッセージを開きます システム指向の非常に単純なオブジェクトを使用して設計されています に直接メールを送信してください。ここで
電子メールの内容にアクセスする方法の例です:
mail = Mail.read('/path/to/message.eml')
mail.envelope.from #=> '[email protected]'
mail.from.addresses #=> ['[email protected]', '[email protected]']
mail.sender.address #=> '[email protected]'
mail.to #=> '[email protected]'
mail.cc #=> '[email protected]'
mail.subject #=> "This is the subject"
mail.date.to_s #=> '21 Nov 1997 09:55:06 -0600'
mail.message_id #=> '<[email protected]>'
mail.body.decoded #=> 'This is the body of the email...
また、マルチパートメールを解析するだけでなく、テストや添付ファイルを抽出することができます。
私はこの種の例をどこにでも見てきましたが、 '@my_subject_variable = mail.envelope.from'のようなものではありません。それは単なるコピー&ペーストの仕事ですか、誰も同じ例を使用する理由はありますか? –
@HerbMeehanこの例は、リポジトリのREADMEファイルから取得したものです。確かに、あなたが提案した方法でそれを使うことができます。 –
- 1. 電子メール本文を電子メールから抽出する - テキスト解析用
- 2. "@"記号の前のテキストの電子メールを解析する
- 3. 電子メールの解析と処理architechture
- 4. HTML電子メールの整列テキスト
- 5. キュウリは電子メールの解析をテストしますか?
- 6. テキストから電子メールアドレスを解析/トリミングする方法
- 7. htmlソースから電子メールを取得
- 8. PHPからhtml電子メールを送信
- 9. 解析の電子メールは、このぇを使用
- 10. HTMLアラインメントの電子メール
- 11. HTML電子メールの検証?
- 12. HTML電子メールのボタンを電子メールのフォームとして
- 13. PHPスクリプトのパイピングの電子メールの解析
- 14. PHPで未処理の電子メールを解析する
- 15. 電子メールのバウンス通知を解析する方法
- 16. レスポンシブhtml電子メール:outlook
- 17. HTML電子メールの一部が電子メールクライアントのテキストとして表示されるのはなぜですか?
- 18. Python - 電子メール添付ファイルからExcelファイルをダウンロードして解析する
- 19. HTMLからの電子メールの正規表現
- 20. Ruby/Rails HTMLページ解析
- 21. 複数の電子メールへのHTMLフォーム
- 22. 電子メールでxlsファイルを解析する
- 23. perl、すぐに電子メールを解析する
- 24. Pythonで電子メールを解析するときに 'To'フィールド
- 25. 複数のエンコードされたHTML /テキスト電子メールの生成T-SQL
- 26. 電子メールの本文内のhtml電子メールにヘッダーを設定する方法はありますか?
- 27. 電子メール本文の追加テキスト
- 28. HTML電子メールはどのように見えますか?
- 29. 電子メールの動的HTMLコンテンツ
- 30. Djangoの電子メールをHTMLとして
文書内の電子メールはどのように見えますか? –
なぜ正規表現を使用しないのですか?人々は非常に長い時間電子メールを定義する正規表現に対して文字列をテストしています。 –
「電子メール」が意味するものを定義します。 To:/ From:/ Subject:ヘッダーを含む電子メールメッセージ?メールアドレス?それが何であれ、あなたの質問を更新し、より説明的にしてください。また、抽出する対象のデータを含め、スキャンするテキストの例を表示します。 –