2017-02-02 8 views
1

私は、その間にテキストを含む大量の括弧を含むテキストを持っています。文から括弧(および角カッコ内のテキスト)を削除します。

test = "[ete], this is a text" 
generalDatacleaning(test) 

私は何を変更する必要があります。サンプル文でこれを実行する

import re 
def generalDatacleaning(mystring): 
    result = re.sub(r'[]', '', mystring) 
    print(result) 

しかし「ETE」(ブラケットの内側)私を与える:これらのブラケットを取り外す(およびテキスト)のために私は、これは書きましたテキスト部分は削除されますか?

答えて

1

これは動作します:オープニングブラケットと

re.sub(r"\[[^]]*\]", "", test) 

開始し、閉じ括弧ではありません、その中のすべてのものを取り、閉じ括弧を取ります。すべてを空の文字列に置き換えます。

。*よりもはるかに効率的ですか? ( "Backtracking"と呼ばれるものは必要ありません)、括弧内の改行でも動作します。

関連する問題