2017-02-02 7 views
1

私はPandasデータフレームの2つの列間に重複を削除する効率的な方法を探しています。だから、私のデータは、私はそれを取得したいパンダドロップ2列間の重複

A B 
0 1 0 
1 1 1 
2 nan 2 
3 8 3 
4 7 7 

で、

A B 
0 1 0 
1 nan 2 
2 8 3 

は、どのように私はそのような出力を得ることができますか?ありがとう!

答えて

5

はこれを試してみてください:

df = df[df.A != df.B] 

要求されるようにループを使用して:

dups_index = [] 
for i, row in df.iterrows(): 
    if row['A'] == row['B']: 
     dups_index.append(i) 
df = df[~df.index.isin(dups_index)] 
+0

それは動作しますが、私は多くのことを、それは効率的ではないと思います。 : – anniejcannon

+0

申し訳ありませんより効率的なアプローチを見つけたら、私に教えてください:) –

+0

これはループ内ではおそらく効率的ではありません。しかし、私はそれを私の答えに加えます。 –