私はウェブページを持っています。それから、私はすべてのIMGタグを見つけて、それらのIMGタグのSRCを取得したいと思います。IMGタグからsrcを見つけるための正規表現
これを行う正規表現は何でしょうか。
説明:
ウェブページをスクラップしています。すべてのデータは画像を除いて正しく表示されます。これを解決する 、すごい私はSRCを見つけ、それを交換するアイデア、持っている:あなたはあなたが欲しい、正規表現を望んでいない例えば
/images/header.jpg
をして
www.stackoverflow/images/header.jpg
これは人の要件によって異なります。もし彼がそれをユーザーの入力から突き止めたいのであれば? –
彼はまだそれをパーサにロードすることができます。正規表現がHTMLを解析するのが悪い考えである理由を説明してきました。 –
うわー、それは 'パウロ'の戦いです:-) – paxdiablo