2009-07-02 19 views

答えて

3

いいえ、「一致」する必要はありません.HTMLノードを抽出する必要があります。 HTMLパーサーを使用します。 HTMLパーサは、使用が簡単であり、変更に対してより堅牢であり、拡張が容易である(例えば、同じ文書のより多くの部分を取り込む)。一方、正規表現は、HTMLが通常の言語ではないので、間違ったツールになります

+0

私の小さな正規表現の探査を取り除き、それからよく知られている土地に戻るでしょう。私はとにかくそれを働かせることはできません ありがとうございました。 –

1

これら二つのタグの間にあるすべては数ではない、と全く空白またはどちらかといえば、あなたは、単にこの正規表現を使用することができます:空白があるかもしれない場合

/<htmltag>([0-9]+)<\/htmltag>/ 

それともこれを:

/<htmltag>\s*([0-9]+)\s*<\/htmltag>/ 
+0

ありがとう私の質問に表示されるものは、HTMLタグを表示するためにスキップするため、書いたものではありません。< –

+0

'\ w'は空白文字ではなく単語文字です。 '\ s'は空白文字です。 – Gumbo

+0

Gumboが指摘しているように\ wは\ sでなければなりませんが、数字の前後に空白のインスタンスをゼロにするために+を*に変更することもできます。また、\ dは数字の素敵なショートカットです。結果:/ \ s *(\ d +)\ s * <\/htmltag>/ –

関連する問題