2011-07-28 11 views
2

こんにちは私は以下のテキストを持っています。regex pythonを使って複数行テキストを抽出するには

X = "" "こんにちは、これは\ nmultilineテキスト\ nend.Hello、これは\ nの二 chunckの\のNENDです。" ""

こんにちはのこのパターン、\ NEND 。繰り返す。私はこれらの2つの単語の各セットの間にテキストを抽出したいと思います。私はこの

を使用してみました、B = re.search(R '(?< =こんにちは)。+(?=終了)'、X、re.DOTALL)

が、私はすべてを取得します最初から最後までのテキスト。別々のテキストを取得するにはどうすればよいですか?

Thanks.p

+0

別々のチャンクではどういう意味ですか?私たちに期待される出力を与えてください。 –

答えて

6

lazy quantifierを使用してください:.+?の代わり.+

問題は.+が可能な限り一致しているため、ドキュメントの最後までしか食べていないということです。疑問符を追加すると、可能な限り一致するように指示されます。

+0

ありがとう、それは働いた。 b = re.findall(r '(?<= Hello、)。+?(?= end)'、x、re.DOTALL); b.group() – pogo

関連する問題