内部企業Webアプリケーションのテキスト領域のテキストからいくつかのオプションを抽出する次のPythonスクリプトに問題があります。カンマまたは改行に一致する正規表現ですが、両方は一致しません
import re
text = 'option one\noption two, option three, option four'
correct = 'option one, option two, option three, option four'
pattern = re.compile('(\s*[,]\s*)')
fixed = pattern.sub(', ', text)
print fixed
option one
option two, option three, option four
print fixed.split(', ')
['option one\noption two', 'option three', 'option four']
これは明らかに分割することができない「オプションの1」に「オプション1を2 nオプション\」、「オプション2つの」
ので、入力は希望
option one
option two, option three, option four
として終わる可能性
option one, option two, option three, option four
に変換する必要があり、それが正常に動作しますその場合はカンマ
または
ではなく、改行が続くコンマ
あればそれだけでそのわずか改行。
're.split'は確かに答えです。 –
私は少し奇妙な分割方法に気付かなかった!しかし、私はとにかくpythoniteではありません... :) –
ニース、 '(\ s * [、\ n] \ s *)は完璧に働いています、ありがとうtdammers :-) – nih