Python re.matchで文字列を抽出する

import re 
str="x8f8dL:s://www.qqq.zzz/iziv8ds8f8.dafidsao.dsfsi" 

str2=re.match("[a-zA-Z]*//([a-zA-Z]*)",str) 
print str2.group() 

current result=> error 
expected => wwwqqqzzz

文字列wwwqqqzzzを抽出します。私はどのようにそれを行うのですか？Python re.matchで文字列を抽出する

はたぶんのようなドット、多くのがあります。この場合

"whatever..s#[email protected]:af//wwww.xxx.yn.zsdfsd.asfds.f.ds.fsd.whatever/123.dfiid"

、私は基本的に//と/で囲まれたものが欲しいです。どのように達成するのですか？

1つの追加の質問：

import re 
str="xxx.yyy.xxx:80" 

m = re.search(r"([^:]*)", str) 
str2=m.group(0) 
print str2 
str2=m.group(1) 
print str2

はm.group(0)とm.group(1)が同じであるようです。

出典

2012-11-16 runcode

あなたはドットが、最終的な文字列から削除したいのですか？ – danseery

はい、私はちょうど純粋な文字[a-zA-Z] * //と/の間に、 '//'の前に '/'の後に束の文字があり、 – runcode

match文字列全体に一致しようとします。代わりにsearchを使用してください。次のパターンは、あなたの要件に一致します

m = re.search(r"//([^/]*)", str) 
print m.group(1)

は基本的に、我々は/を探しているし、できるだけ多くの非スラッシュ文字を消費します。これらのスラッシュでない文字は、グループ番号1でキャプチャされます。

実際には、同じ処理を行う少し高度なテクニックがありますが、キャプチャ（通常は時間がかかります）は必要ありません。これはlookbehindいわゆるを使用する：

m = re.search(r"(?<=//)[^/]*", str) 
print m.group()

前後参照は、従って、実際の試合、所望の結果には含まれません。

この（または他の合理的な正規表現の解決策）はすぐに.を削除しません。しかし、これは簡単に2番目のステップで行うことができます：

m = re.search(r"(?<=//)[^/]*", str) 
host = m.group() 
cleanedHost = host.replace(".", "")

これは正規表現を必要としません。もちろん

、あなたが（例えばwwwregularexpressionsinfoへwww.regular-expressions.infoをオンにする）文字と数字以外のすべてのものを削除したい場合、あなたはreplaceの正規表現のバージョンを使用したほうが良いです：

cleanedHost = re.sub(r"[^a-zA-Z0-9]+", "", host)

出典

2012-11-16 20:07:36

どのようにドットを削除するのですか？ – runcode

申し訳ありませんが、私はその要件を見ました。別のステップを実行するだけです： 'resultstr.replace（r"。 "、" "）'。それを2番目に入れる予定です。 –

ああ...スマート！ありがとう！ – runcode

print re.sub(r"[.]","",re.search(r"(?<=//).*?(?=/)",str).group(0))

を参照してください。 this demo。

出典

2012-11-16 20:19:41

output=re.findall("(?<=//)\w+.*(?=/)",str) 

final=re.sub(r"[^a-zA-Z0-9]+", "", output [0]) 

print final

出典

2014-08-14 15:59:57

-1

import re 
str="x8f8dL:s://www.qqq.zzz/iziv8ds8f8.dafidsao.dsfsi" 
re.findall('//([a-z.]*)', str)

出典

2017-01-16 10:58:16 nitinvijay23

コードは問題を解決するかもしれませんが、それはそれ自身の答えではありません。 1つは常にそれに説明を加えるべきです。 – BDL

Python re.matchで文字列を抽出する

答えて

関連する問題