formatted Pythonでファイルから入力

私はPythonプログラムにファイルを読み込み、その上にトークナイザを適用してテキストを文のセットに分割しようとしています。しかし、私の出力では、出力で避けたい '/ n'文字を取得しています。これは、文章の次のプロセスを妨げる可能性があるためです。私はread（）コマンドを使って入力を読みました。 readline（）も試しました。私はまだ私の出力に改行文字を取得しています。これを避けるための提案はありますか？formatted Pythonでファイルから入力

file_sent = open(path,'r') 
all_sents = file_sent.read() 
sent_all = print all_sents 
tokenized_sents = sent_tokenize(sent_all)

出典

2011-10-28 madCode

"\ n"は改行のテキストシンボルです。 – Shakakai

私はそれを知っています。 – madCode

そのコードは実行しないでください。 'sent_all = print all_sents'行は、「無効な構文」エラーを引き起こします。この仕事をするためにあなたは何をしていますか？ –

あなたが完全に改行を削除する場合：

all_sents = file_sent.read().replace('\n', '')

あなたは、スペースでそれらを交換する場合：明らか

all_sents = file_sent.read().replace('\n', ' ')

あなたが望んでいた場合は何か他のものに置き換えることができ。

出典

2011-10-28 23:28:01 kindall

本当です、ありがとう！しかし私は同じことをすることができる他の方法があるかどうか疑問に思っていました。 – madCode

あなたはまったく別の方法を考えていますか？あなたはそれを処理の他の時点で行うことができます。たとえば、単語に分割した場合、 '.split（）'を使うと、改行を含むあらゆる種類の空白でうまく動作し、その時点で消えてしまいます。 – kindall

formatted Pythonでファイルから入力

答えて

関連する問題