2011-12-05 16 views
2

たとえば、文字列 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG'がある場合 私はATGとTTGの間で部分文字列を取得する必要があります。Pythonの文字列から複数の部分文字列を見つける方法

私はそれを行うにはとにかく考え出すことはできません、PLZは私を介してそれを手伝って!

+0

ことが可能です(完全に、または部分的に)重複する 'ATG ... TTG'シーケンスのため? – ekhumoro

+0

「TTG」の逆の検索はどうですか? –

答えて

8

正規表現を使用すると簡単にそこにアクセスできます。例えば

import re 
a = 'ATGAGGGATAGAGGGTTGGGAGAGATGGATAGGGGATAGATTG' 
print re.findall("ATG(.*?)TTG", a) 

出力:

['AGGGATAGAGGG', 'GATAGGGGATAGA'] 
+0

ありがとうございました –

+0

これは重複する部分文字列を見つけることができないようです。詳細はhttp://stackoverflow.com/questions/8390913/how-to-select-only-certain-substrings – HongboZhu

+0

ここで得られる出力の種類は{リストまたは文字列またはシーケンス} –

関連する問題