2016-09-24 3 views
0

私はWatson Alchemy APIを使って哲学と古典的なテキストを分析しようとしています。私のコンピュータ上の.txtファイルからPython変数にテキストを読むことに問題があります。バッファに読み込まれていないテキスト

from __future__ import print_function 
from alchemyapi import AlchemyAPI 
import argparse 
import json 



def conceptual(fileName): 
    path = "/Users/myname/Desktop/texts/" 

    name = path + fileName 

    with open(name, 'r') as myfile: 
     data=myfile.read().replace('\n', ' ') 

    if data != None: 
    print(data) 


def main(): 
    parser = argparse.ArgumentParser() 
    parser.add_argument('--concepts', dest = 'conceptFile', required = False) 

    args = parser.parse_args() 

    if args.conceptFile: 
     conceptual(args.conceptFile) 
    else: 
     print('Use CL args.') 

main() 

問題はいくつかのテキストのために、それが正常に動作していることである:全体の.txtファイルのプリントアウトターミナルウィンドウにここで

はコードです。その特定のファイル(Zarauthstra_Nietzsche.txt)の終わりが

Thus spake Zarathustra and left his cave, glowing and strong, like a 
morning sun coming out of gloomy mountains. 


        THE END 
ある

.      THE ENDy mountains. glowing and strong, like a 

:他の人にとっては、この(出力は働いていないすべてのファイルに対して、この非常によく似ている)のようなものを出力します

ただし、ファイルの残りの部分は印刷されません。

私はさまざまな相違点を修正していますが、ここやそこで調整していますが、動作しないものの唯一の共通スレッドは、別のWebサイト(http://philosophy.eserver.org/texts.htmではProject Gutenbergではありません)からダウンロードしたものです。私はファイルのパス、内容、アクセス権、ファイル名を変更しようとしました。何か案は?

+0

とすることができませんでしたなしそうではないことを確認あなたは 'もしデータ=なしでやっている:!'また、関数内で何ですか?あなたのインデントやロジックはオフに見える –

+0

大丈夫、私はそこにあると思う私はちょうど安全であった。しかしそれは出力に何の影響も与えてはいけません。また、ちょうど更新されたインデント – cb3k

+0

あなたが何らかの形でキャリッジリターンを持っていなければ、それは正常に動作するはずですが、エラーを再現するファイルの名前は何ですか? –

答えて

1

ファイル内の\ r文字が何らかの形で乱れています。

は、この行を変更:data=myfile.read().replace('\n', ' ')データdata=myfile.read().replace('\n', ' ').replace('\r', ' ')

関連する問題