2016-11-26 6 views
1

:私は私はこのようになりますデータフレーム持って重複レコードのための新しい平均スコアを作成し、[ユーザーID、アイテムID]

userid itemid score 
1  5  22 
2  3  20 

userid itemid score 
1  5  4 
2  3  10 
1  5  20 
2  3  30 

を、私はこのデータフレームを変換したいです2 forループを使用してこれを行う予定です。しかし、私はこの作業を達成するために推奨されるアプローチがあるのだろうかと思います。 groupbyは、average機能がないため動作していないようです。どんな助け?

+2

を使用するようにしてください/pandas.core.groupby.GroupBy.mean.html) – MaxU

答えて

1

あなたは(http://pandas.pydata.org/pandas-docs/stable/generated [Groupby.mean()]を探しているgroupbysum

df.groupby(['userid', 'itemid']).mean() 

enter image description here

+0

答えをありがとう!他の列もある場合には、「スコア」列の平均をとることをどのように知っていますか? – renakre

+0

これは必要に応じて調整することができます。質問に多くの情報を入力すればよいほど良いでしょう。私が提供したものは、数値であるすべての列の平均を見つけるでしょう。 – piRSquared

+0

私は参照してください。私はもう1つの質問をするかもしれません: 'userid'と' itemid'カラムが私の出力の結果セットに含まれていないと思うのはなぜですか? – renakre

関連する問題