2016-05-03 5 views
1

私は200分以下の観測値を持つ曜日を除外したいと思います。次のように私のデータが見えます:パンダ、Python。観測数に応じて日数を除外する方法は?

Time         
    2009-01-30 09:30:00 85.1100 100.1100 
    2009-01-30 09:39:00 84.9300 100.0500 
    2009-01-30 09:40:00 84.9000 100.0000 
    2009-01-30 09:45:00 84.9100 99.9400 
    2009-01-30 09:48:00 84.8100 99.9000 
    2009-01-30 09:55:00 84.7800 100.0000 
          ...  ... 
    2016-02-29 15:58:00 193.7200 24.8300 
    2016-02-29 15:59:00 193.4800 24.8700 
    2016-02-29 16:00:00 193.6100 24.8300 
    2016-03-01 09:30:00 195.2200 24.3099 
    2016-03-01 09:31:00 195.1000 24.3300 
    2016-03-01 09:32:00 195.1500 24.3100 
    2016-03-01 09:33:00 195.1100 24.3800 

まず列あなたはおそらくこれは、データと、いくつかの分のデータセットから欠落している分で述べたように、DateTimeIndexです。私は分データのリサンプリングとNA値の扱いを避けたいと思いますが、インデックスに基づいて日を除外する方法を見つけることができます(今日は200分以上の観測があります)。 200分観測は中止されます。

答えて

4

は、次のようにのような何かをしようと、Timeが列(いないインデックス)であると仮定:

Timeカラムがインデックスの場合 col1は、列名

ある

df.ix[df.groupby(df['Time'].dt.date)['col1'].transform('count') > 200] 

df.ix[df.groupby(df.index.date)['col1'].transform('count') > 200] 

UPDATE:パンダ0.20.1 the .ix indexer is deprecated, in favor of the more strict .iloc and .loc indexersから始まる

したがって、廃止予定の代わりにdf.loc[...]を使用してください。df.ix[...]

関連する問題