Pythonでは、指定された式の間に何かが発生した場合にマッチしたいと思います。たとえば:環境を使わずに正規表現を引き出す
dogdogacowadogdog <-- search a word between 'a' characters
<span>tiger<a> <-- search for sth between <span> and <a>
私は間だけ、この何かに合わせたいのですが、それはcow
とtiger
はそれぞれでしょう。 rexexes使用している場合しかし、:
r'a(.*)a'
r'<span>(.*)<a>'
をそれは私に行全体を印刷していないだけで、この私が((.*)
にマッチしているもの)を探しています。どうすればこの情報を引き出すことができますか?
'(。*?)'(怠惰なマッチング)のように聞こえます。また、正規表現を使ってHTMLを解析していないことを願っています。 –
're'関数を使っていますか? –
キャプチャグループを使用する必要があります。 – Whitefret