2017-11-07 13 views
0

read_csvこのエラーを返します。 Initializing from file failedlatin-1,utf-8 andISO-8859-1を使用しています。pandas.read_csvの標準文字エンコード

from pandas import * 

df = dict(A=[1,2,3],B=['abc','efg','hig'],C=[100,200,300]) 
df = DataFrame(df) 
df 

    A B C 
0 1 abc 100 
1 2 efg 200 
2 3 hig 300 

私は次のようにドイツ語の文字とそれを書いた:

df.to_csv('Lück.txt', sep='\t', encoding ='utf-8', index=False) 

、それはこの方法でそれをインポートに失敗:

read_csv('Lück.txt', sep='\t', encoding = 'utf-8') 

すべての後に検出するアリ方法がある場合特別なドイツ人のキャラクター私はそれを置き換えます。

P.S.私はこの問題の記事の数を見てきましたが、それらのどれも私の質問と一致せず、私は標準の文字のデコード/エンコーディングには満足していません。

+0

'Lück'は変数ですか? –

+0

実際には名前のリストにあり、変数が特殊なドイツ語の文字に到着したときに問題が発生しますが、ここでは例として文字列として直接書きました。 – Hamidreza

+0

リストを文字列に連結することはできません。 –

答えて

1

根本的な原因はドイツ語のウムラウトではなく、.csvファイル内の1つ以上の「奇妙な」whitespace文字です。これらは特に.csvファイルが何らかの種類のcopy/paste operation to excelで事前に修正された場合に発生します。 hereまとめたように、あなたの.csvファイルは、奇妙なwhitespaace文字のいずれかの種類が含まれていないことを確認して、

#!/usr/bin/env python 
# -*- coding: utf-8 -* 

第二:

まず、このようなあなたのPythonスクリプトを開始します。

+0

問題が解決されていない場合でも、ありがとうございます。元々このファイルは 'xlsx'ファイルから抽出されたデータによって作成されているため、読み書き操作が原因である可能性があります。 – Hamidreza

関連する問題