0
を削除します。私は、カラムに以下DF1行0と3の例ではデータフレーム私はこのような問題を有するデータフレーム一意の行から
から一意の値が
A B C
0 5 100 5
1 1 200 5
2 1 150 4
3 3 500 5
を除去すべきた行を削除する必要があります
私は思ったまで一つの解決策は、今では次のとおりです。
- GROUPBY(A)各グループの
- count行
- フィルタアウトカウント> 1
- DF2
- DF1.intersect(DF2)
任意の他のアイデアにつながる保存しますか? RDDのソリューションも役立ちますが、DataFrameの方が良いでしょう ありがとう!
ありがとう!あなたは私を助けてくれた! – feechka