次のHTML構造をperlで解析しようとしています。クラスメッセージとidを含むdd要素のすべてを選択する必要があります。 私がスクリプトにしたいのは、すべてのdd要素をループしてdd要素のidを出力することですが、最初のdd要素を静的で無視して変更する必要はありません。perlでHTMLを解析する
cpanからインストールして簡単にインストールできるのであれば、どのperlモジュールでも使用できます。私はperlとHTMLの解析に多くの経験を持っていないので、どのポインタも非常に役立つでしょう。
感謝:)
HTMLの構造:
<pre><code>
<html>
<head>
</head>
<body>
.....other elements
<div id="messages">
<div class="header"></div>
<dl>
<dd class="message unread mc-friend mc-message">This is just a random message, do not parse</dd>
<dd id="msg2" class="message unread mc-message">
Hello
</div>
<dd id="msg3" class="message unread mc-message">
Hello
</dd>
</dl>
</div>
</body>
</html>
</pre></code>
次の[このような何か](http://lmctfy.org/html%20parser/)をしてみてくださいましたか? – Ether
うわー、私はGoogleのものを見ていたが、それはずっとうまくいった:Pしかし、はい、そこにたくさんあるようだが、私はどちらと一緒に行くのか分からない。 – Jack
:)一般的にはHTML :: Parserは素晴らしいですが、別の場所にあなたを指し示す特定のニーズがあるかもしれません。ここにも同様の質問のアーカイブがあり便利なヒントを与えてくれるでしょう。 – Ether