2016-07-28 12 views
1

2つの列を持つDataFrameで100行が与えられたとします。 1つはQUERYで、その他はPRODUCTです。 QUERY値とPRODUCT値の両方を繰り返すことができます。Python - 与えられたクエリに関する製品の頻度の計算

Sr.No  QUERY PRODUCT 
    1 mobile samsung 
    2 mobile  sony 
    3 mobile samsung 
    4 laptop samsung 
    5 laptop  sony 

のような出力が

Sr.No  QUERY PRODUCT FREQUENCY 
    1 mobile samsung   2 
    2 mobile  sony   1 
    3 mobile samsung   2 
    4 laptop samsung   1 
    5 laptop  sony   1 

する必要があります重複した値を省略すべきではないことに注意してください。 これをPythonでどうやって行うことができますか?

答えて

0

使用transform

df['FREQUENCY'] = df.groupby(['QUERY', 'PRODUCT'])['PRODUCT'].transform('size') 
print (df) 
RangeIndex(start=0, stop=5, step=1) 
    Sr.No QUERY PRODUCT FREQUENCY 
0 1.0 mobile samsung   2 
1 2.0 mobile  sony   1 
2 3.0 mobile samsung   2 
3 4.0 laptop samsung   1 
4 5.0 laptop  sony   1 
+0

感謝の男! それは魅力的に機能しました。 – Ishan

+0

私の答えが役に立ったら、[同意する](http://meta.stackexchange.com/a/5235/295067)を忘れないでください。ありがとう。 – jezrael

+0

私はあなたの答えを投票しましたが、それが表示されています:評判が15未満の人の投票が記録されますが表示されません。私はここで新しいです。 – Ishan

関連する問題