1
私はPandasを使い慣れていないので、不要なカラムを削除して重複レコードを削除しようとしています。スクリプトの最初の部分は、列が削除されるときに機能します。しかし、スクリプトは残りの複製がたくさんあるので、タスクの第2部分を実行していません。どんな助けでも大歓迎です。これは、また、一般的にはほぼすべてのパンダのOPSはコピーを返すパンダスクリプトが重複を削除しない
new_f = new_f.drop_duplicates()
または
new_f.drop_duplicates(inplace=True)
docs状態、ほとんどのサポートinplace
:
import pandas as pd
f =pd.read_csv("filename.csv")
keep_col =['ZIP5','STATE CODE','STATE','COUNTY CODE','COUNTY NAME','CBSA CODE','CBSA TITLE','CBSA LSAD','METRO DIVISION CODE','METRO DIVISION TITLE','METRO DIVISION LSAD','CSA CODE','CSA TITLE','CSA LSAD']
new_f = f[keep_col]
new_f.drop_duplicates()
new_f.to_csv("newfile.csv", index=False)