read_csv()とread.csv()を使用してRにCSVファイルをインポートすると問題が発生します。それらの変数のほとんどは整数です。 read_csv()を使用すると、整数であるいくつかのセルがNAに変換され、次の警告が表示されます。しかし、これらのセルも整数なので、なぜそれが間違っているのかわかりません。Rでread_csv()解析の失敗:整数をNAに変換する
10487 parsing failures.
row col expected actual
3507 X27 an integer 2946793000
3507 X46 an integer 5246675000
3508 X8 an integer 11599000000
3508 X23 an integer 2185000000
3508 X26 an integer 2185000000.
df [3507,27]にアクセスすると、NAと表示されます。また、X27、X46、およびX8はすべて整数なので、関数がほとんどの行で機能する理由はわかりませんが、それらの行では機能しません。
ただし、私はread.csv()を使用しています。それは動作し、2946793000を返します。 なぜ、これらの2つの関数が異なる動作をするのか教えてください。
'read_csv'は、データの最初の行を見て、その列のデータ型を推測します。特に大量のデータセットでは、間違って推測されることがあります。たとえば、私は 'readr'がブール値であると考えられるジェンダー列を持つデータセットを持っていました(すべての最初の行は" F "でした)。最初のエラーが発生した行までファイルの 'head'を読み込み、文字列の書式があるかどうかを確認してください。問題のある列を文字として読み取って数値に変換するよう強制することもできます。 –