2016-10-20 6 views
1

私はPandasを使い慣れていないので、不要なカラムを削除して重複レコードを削除しようとしています。スクリプトの最初の部分は、列が削除されるときに機能します。しかし、スクリプトは残りの複製がたくさんあるので、タスクの第2部分を実行していません。どんな助けでも大歓迎です。これは、また、一般的にはほぼすべてのパンダのOPSはコピーを返すパンダスクリプトが重複を削除しない

new_f = new_f.drop_duplicates() 

または

new_f.drop_duplicates(inplace=True) 

docs状態、ほとんどのサポートinplace

import pandas as pd 
f =pd.read_csv("filename.csv") 
    keep_col =['ZIP5','STATE CODE','STATE','COUNTY CODE','COUNTY NAME','CBSA CODE','CBSA TITLE','CBSA LSAD','METRO DIVISION CODE','METRO DIVISION TITLE','METRO DIVISION LSAD','CSA CODE','CSA TITLE','CSA LSAD'] 
    new_f = f[keep_col] 
    new_f.drop_duplicates() 
    new_f.to_csv("newfile.csv", index=False) 

答えて

2

あなたは戻って割り当てるかinplace=Trueを渡す必要がありますあなたが上書きするか、inplace=trueがサポートされている場合に渡すかのどちらかを割り当てる必要があります。

関連する問題