2013-12-19 6 views
6

私は大規模なデータフレームをいくつかの列でグループ化し、ボックスプロットを使用してグループごとの分布をグラフィカルに調べます。私は、df.boxplot()がデータフレームの各列に対してそれを行い、必要に応じて1つのプロットに配置することがわかりました。列でグループ化してから、パンダのインデックスでboxplotを実行する

問題は、groupby操作の後、私のデータはインデックス内のグループラベルを持つすべての列にあるため、結果でboxplotを呼び出すことができません。ここ

は一例です:

df = DataFrame({'a':rand(10),'b':[x%2 for x in range(10)]}) 
df 

     a b 
0 0.273548 0 
1 0.378765 1 
2 0.190848 0 
3 0.646606 1 
4 0.562591 0 
5 0.409250 1 
6 0.637074 0 
7 0.946864 1 
8 0.203656 0 
9 0.276929 1 

は今、私はB列でグループ化すると1箱ひげ図で両群の分布を箱ひげ図。どうやってやるの?

答えて

12

by引数はboxplotです。それはあなたが探しているものですか?

df.boxplot(column='a', by='b') 
+2

笑とても簡単... ​​:) – idoda

+0

は、[ドキュメント](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrameで 'COLUMN'の説明を発見.boxplot.html)super confusing - "* groupbyへの有効な入力*" - この答えを見て回想すると意味があります:) – Owen

関連する問題