私はこのようになりますデータフレーム持って重複レコードのための新しい平均スコアを作成し、[ユーザーID、アイテムID]

userid itemid score 
1  5  22 
2  3  20

：

userid itemid score 
1  5  4 
2  3  10 
1  5  20 
2  3  30

を、私はこのデータフレームを変換したいです2 forループを使用してこれを行う予定です。しかし、私はこの作業を達成するために推奨されるアプローチがあるのだろうかと思います。 groupbyは、average機能がないため動作していないようです。どんな助け？

2016-11-26 renakre

を使用するようにしてください/pandas.core.groupby.GroupBy.mean.html） – MaxU

あなたは（http://pandas.pydata.org/pandas-docs/stable/generated [Groupby.mean（）]を探しているgroupbyとsum

df.groupby(['userid', 'itemid']).mean()

2016-11-26 23:16:00 piRSquared

答えをありがとう！他の列もある場合には、「スコア」列の平均をとることをどのように知っていますか？ – renakre

これは必要に応じて調整することができます。質問に多くの情報を入力すればよいほど良いでしょう。私が提供したものは、数値であるすべての列の平均を見つけるでしょう。 – piRSquared

私は参照してください。私はもう1つの質問をするかもしれません： 'userid'と' itemid'カラムが私の出力の結果セットに含まれていないと思うのはなぜですか？ – renakre

答えて