データフレームを 'タイプ'列でグループ化し、同じ番号の各シーケンスから最初の番号を取得したいと考えています。次の例では示していますグループAについてパンダのグループ内の同じ番号のシーケンスで最初の数字を抽出する
A = pd.DataFrame({'type':['A','A','A','A','A','A','A','A','A','B','B','B','B','B'], 'value':[1,1,1,1,8,8,8,1,1,2,2,3,3,2]})
は、そこに、8のの、第1のシーケンスであり、1の終。グループBには、2のうちの最初の1つ、3の1つ、2の最後の1つがあります(1つの要素のみ)。その結果、BのAの1,8,1および2,3,2にすべきである:
type value
0 A 1
1 A 8
2 A 1
3 B 2
4 B 3
5 B 2
なお、第1 A.groupby( 'タイプ')()を使用してもA.groupby( 'タイプ。 ')。(lambda x:x.unique())はどちらの場合も最後の1と最後の2が無視されるために機能します。これは、同じ数字の各シリーズを識別するインデックスがある場合、これは自明であることに注意してください。
ありがとうございました、私はすべてのあなたの助けに感謝し、
はタイプによってソートされたデータフレームですか? – ayhan
ayhanありがとうございます。それはタイプ別にソートされています – dleal