0

私はこのDFを持っています。パンダグループのデータからヒストグラムを取得できません

次のデータを生成
f = { 'Router_name':['count'] } 
a = a.groupby(['Week_end']).agg(f) 

..

  Router_name 
       count 
Week_end    
29     3 
30    10 
31     6 
32     4 
33     9 
34     2 
35     5 
36    10 
37     8 
38     6 
40    10 
41     2 
42     8 
43     1 
44     3 
45     2 
46     8 
47     6 
49    12 
50     5 
51    10 
52     5 
53    11 

私はRouter_nameのため、以前の集計されたデータのうち、ヒストグラム/周波数を取得しようとしています。したがって、たとえば、予想される出力は、これらの周波数必要があります。

enter image description here

私はb = a.hist(by=a['Router_name'])を行うことはトリックを行うだろうとhere読みました。

Traceback (most recent call last): 
    File "get_report_v1.5_devel.py", line 465, in <module> 
    b = a.hist(by=a['Router_name']) 
    raise ValueError("Grouper for '%s' not 1-dimensional" % t) 
ValueError: Grouper for '<class 'pandas.core.frame.DataFrame'>' not 1-dimensional 

は、私もこれを試してみました:a.Router_name.hist()しかし、私は次のエラーを取得することを試みるとき。しかし、私は同じDataFrameを取得します。

グループ化されたデータから特定の列の頻度を取得するにはどうすればよいですか?

答えて

1

ことではagg

a.hist(by=a[('Router_name','count')]) 

a[('Router_name','count')].value_counts() 
Out[1678]: 
10 4 
8  3 
6  3 
5  3 
2  3 
3  2 
12 1 
11 1 
9  1 
4  1 
1  1 
Name: (Router_name, sum), dtype: int64 
+0

こんにちはを使用してマルチインデックスを作成し、あなたのように思えます!あなたの提案を試みましたが、得られたテーブルを印刷しようとすると、一連のリストのようなものが得られました: '[ 。さらに、私はそれをプロットしようとしました( 'ax1 = b.plot(。)')、got: 'AttributeError: 'numpy.ndarray'オブジェクトには属性 'plot'がありません。この結果をどのように管理するのですか? –

+0

@LucasAimaretto結果はあなたが共有したリンクに従っています、あなたはあなたの期待される出力を表示できますか? – Wen

+0

こんにちは@私は、私が得ることを期待していることを示すために質問を更新しました。基本的には、グループ化されたデータの出現頻度を取得しています。 Excel/Calcでは、ピボットテーブルを使って、または 'Frequency()'式を使ってそれを行うことができます。 –

関連する問題