2016-10-19 4 views
-1

データフレームには、イベントごとにid列と(他の列の中でも)value列のデータセットがあります。私がしたいことは、値の列の頻度分布の90パーセンタイル、50パーセンタイル、25パーセンタイルなどに基づいて、それぞれidを分類します。パンダの列に基づいて各行のパーセンタイルをチェックする方法は?

例、

id  value 
1  12.5 
2  4.6 
.... 

だから、私はそれを行うにはどうすればよい。それにcategoryはそれがで落ちる値列のどのパーセンタイルに応じて、別の列を追加したいですか?

+0

私の答えはあなたが期待したものではありませんでしたか? – IanS

答えて

0

あなたはquantileメソッドを探しています。たとえば、0.0, 0.25, 0.5, 0.75分位数に割り当てることは、次のように行うことができます。

df['quantile'] = 0.0 

for q in [0.25, 0.5, 0.75]: 
    df.loc[df['value'] >= df['value'].quantile(q), 'quantile'] = q 
関連する問題