groupby
機能を使用せずに、列b
の最初の行の値と列b
の最後の行を列a
でグループ化して比較する方法を教えてください。 groupby関数は大規模なデータセットでは非常に遅いためです。pandas dataframe各グループの最初と最後の行を比較します
a = [1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3]
b = [1,0,0,0,0,0,7,8,0,0,0,0,0,4,1,0,0,0,0,0,1]
戻り二つのリスト:1は、ここに
larger_or_equal = [1,3]
smaller = [2]
私はちょうど質問を理解している場合、私は、このための答えを持って知っています。あなたが話していることを説明するもう少し仕事をすることができますか? – piRSquared
'groupby(sort = False)'を試したことがありますか?これにより、大規模なデータセットで処理が高速化されます。 – IanS
@ piRSquaredでは、グループの最後の要素が最初の要素以上であるため、グループ「1」と「3」が選択されます。 – IanS