2016-08-08 5 views
0

の長さと一致していない私はdaskをこのように使用してCSVファイルを読みました:DASKエラー:値の長さがインデックス

import dask.dataframe as dd 
train = dd.read_csv('act_train.csv') 

その後、私はパンダにはかなりうまく動作し、行ごとの簡単なロジックを適用したいと思います:

columns = list(train.columns) 

for col in columns[1:]: 
    train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1]) 

残念なことに、コードの最後の行は、次のエラーが発生する:値の長さは、インデックスの長さと一致しない

私は間違って何をしていますか?

+0

こんにちは@Rocketq、データセットなしで誰かが簡単に実行できるサンプルを提供できますか? http://stackoverflow.com/help/mcve – MRocklin

答えて

0

xにx.split( '')よりもスペース文字が含まれていない場合、単一要素xを含むリストが返されます。

したがって、 x.split( '')[1]を呼び出して、x.split( '')の2番目の要素にアクセスしようとしています。

x.split( '')のインデックス1に要素がないため、値の長さがインデックスの長さと一致しません。

+0

いいえ、パンダでコードは正常に動作します – Rocketq

+0

@Rocketqすべてのxに空白文字が含まれていれば正常に動作します – surru

+0

はい、その問題は別のものと関連しています – Rocketq

関連する問題