2011-10-28 4 views
0

私はPythonプログラムにファイルを読み込み、その上にトークナイザを適用してテキストを文のセットに分割しようとしています。しかし、私の出力では、出力で避けたい '/ n'文字を取得しています。これは、文章の次のプロセスを妨げる可能性があるためです。 私はread()コマンドを使って入力を読みました。 readline()も試しました。私はまだ私の出力に改行文字を取得しています。これを避けるための提案はありますか?formatted Pythonでファイルから入力

file_sent = open(path,'r') 
all_sents = file_sent.read() 
sent_all = print all_sents 
tokenized_sents = sent_tokenize(sent_all) 
+0

"\ n"は改行のテキストシンボルです。 – Shakakai

+0

私はそれを知っています。 – madCode

+0

そのコードは実行しないでください。 'sent_all = print all_sents'行は、「無効な構文」エラーを引き起こします。この仕事をするためにあなたは何をしていますか? –

答えて

2

あなたが完全に改行を削除する場合:

all_sents = file_sent.read().replace('\n', '') 

あなたは、スペースでそれらを交換する場合:明らか

all_sents = file_sent.read().replace('\n', ' ') 

あなたが望んでいた場合は何か他のものに置き換えることができ。

+0

本当です、ありがとう!しかし私は同じことをすることができる他の方法があるかどうか疑問に思っていました。 – madCode

+0

あなたはまったく別の方法を考えていますか?あなたはそれを処理の他の時点で行うことができます。たとえば、単語に分割した場合、 '.split()'を使うと、改行を含むあらゆる種類の空白でうまく動作し、その時点で消えてしまいます。 – kindall

関連する問題