2016-08-02 25 views
2

私はデータフレームの外観は、この好き持っている:パンダ時系列データの前処理

> dt 
    text timestamp 
0 a 2016-06-13 18:00 
1 b 2016-06-20 14:08 
2 c 2016-07-01 07:41 
3 d 2016-07-11 19:07 
4 e 2016-08-01 16:00 

そして、私は次のように毎月のデータを集計する:

> dt_month 
count timestamp 
0 2 2016-06 
1 2 2016-07 
2 1 2016-08 

元のデータセット(dtが)によって生成することができます:

import pandas as pd 
data = {'text': ['a', 'b', 'c', 'd', 'e'], 
    'timestamp': ['2016-06-13 18:00', '2016-06-20 14:08', '2016-07-01 07:41', '2016-07-11 19:07', '2016-08-01 16:00']} 
dt = pd.DataFrame(data) 

また、時間周波数プロットをプロットできる方法はありますかdt_month?あなたはtimestamp列でGROUPBYでき

答えて

1

to_periodと集計sizeを変換:

print (df.text.groupby(df.timestamp.dt.to_period('m')) 
       .size() 
       .rename('count') 
       .reset_index()) 

    timestamp count 
0 2016-06  2 
1 2016-07  2 
2 2016-08  1 
関連する問題