非常に大きな文字列(300 MB +)があり、その中にいくつかのガベージデータがあります。私はPython 2.7 32ビットを使用しています。大括弧で囲まれた値のため、Pythonの正規表現に問題があります
ユーザーが使用するファイルだけ時間をかけて成長しようとしているので、私は\n
のような改行文字で[linender]
の値を置き換えるためにre.sub
を使用しようとしていますので、私は、文字列操作replace
を使いたくありませんでしたかos.linesep
。
それを行うのに十分な簡単なようなので、私のパターンは次のとおりです。
re.sub('\[lineender]\b, os.linesep, text_value)
これは間違っている文字列全体に置き換えられている唯一の値になります。
サンプルデータ:
s = """A|B|3[lineender]E|F|2M[lineender]"""
私はこの作業を取得するために私の正規表現を変更する必要がどのように上の任意のアイデア? 私は基本的に括弧の単語を改行文字で置き換える必要があります。あなたは、生の文字列としてパターン渡す必要があり
're.sub(R '\ [lineender]'、os.linesep、TEXT_VALUE)' ' –