2011-12-17 8 views
0

URLからテキストを抽出しますか?正規表現の文字グループ化ですか?

/\<a href=([^"]*) .?\>([^\<\/a]*)\<\/a\>+/ 

<a href="_first.asp?FileName=37479676820111216064143">   
<font size="2" face="Tahoma"> 
TEXT I WANT TO EXTRACT 
</font> 
</a> 

に動作していないこの時点でpreg_matchをしようと

があまりにも悪い([^\<\/a]*)午前と間違って何かが正規表現でだとさえ良いチュートリアルを見つけることができません確信しています!

+0

正規表現の方言の**ロット**が存在するため、 'php'タグが追加されました。しかし、 'preg_match'を使っているときには、PHPの方言と見なすことができます。 –

+0

ああ、申し訳ありません私はそれを追加することを忘れて、私の脳は考えて忙しいです –

答えて

0

最初はhref=です。次に引用符で囲まれていない任意の数(例では、次の文字が引用符であるため)、スペース(次の文字文字は引用ではなくスペースです)。

いずれにしても、構造が変更されない限り、これは正規表現で実行可能ですが、it's not really the way to do itです。たぶん

0

/^<a[^>]+>(?:\s*<[^>]+>)*\s*([^<]+)(?:\s*<\/[^>]+>)*\s*<\/a>$/m

が動作しますか?