2016-07-21 2 views
2

私は、pythonノートブックでread.csvを使用してデータセットをインポートしようとしています。 しかし、私のデータセットをインポートすると、各列のデータ型がオブジェクトとして認識されます。 Plz click this image to see the issuepandaデータフレームとしてのcsvファイルのデータ型での問題

csvファイルと同じ列のデータ型を保持できる方法はありますか?

他にも複数の方法で試してみましたが、うまくいきませんでした。もし誰かがこれを行うための正しい機能を教えてくれれば助けになるだろう。インポート中に各列のデータ型を制御する方法がある場合は、それは素晴らしいでしょう。

+0

csvファイルの読み取りに使用していたコードを共有できますか? – pyne

答えて

1

これは、データ型が一貫していない場合に発生します。空白のような整数や文字が含まれます。あなたの実際のデータのサンプルを見ることなく話すのは難しいですが、これが問題だと思います。例えば、

>>> pd.DataFrame([1, 2, '']).info() 
<class 'pandas.core.frame.DataFrame'> 
Int64Index: 3 entries, 0 to 2 
Data columns (total 1 columns): 
0 3 non-null object 
dtypes: object(1) 
memory usage: 48.0+ bytes 

は、この問題を回避するには、次のように「」のような-1(実際の値は、あなたのユースケースに依存するであろう)衆生値と同じように、これらの値を交換する必要があります。

+0

ありがとうアレクサンダー。あなたがそれを言いましたように、それは事件でした。それに影響を与えたデータには、ヘッダの行全体が残っていました。 –

関連する問題