2016-04-07 8 views
2

pandas resample moduleのドキュメントを検索しました。関数で使用可能なパラメータについては説明していますが、これらのパラメータのオプションを教えてくれるわけではありません。例えば、 howパラメータは'sum'の値をとりますが(例に示すように)、他にどのような値がありますか?同様にfillパラメータの場合。誰も私に教えて/これらのパラメータの利用可能な値へのリンクを提供できますか?パンダのリサンプルオプション

答えて

1

時系列機能の開始には、おそらくpandas tutorialです。しかし、それはしません。トピックを徹底的にカバーしてください。

また、Cookbookを見ることもできます。ほとんどのリンクが、次の点を指しています。

メソッド引数のテーブルがPython for Data Analysisにあります。あなたが求める2つのパラメータについては


  1. how - (など'sum''mean'、など)の一般的な機能を示す文字列、配列を取ってカスタム関数とすることができ、 - おそらくそこに記載されていないもの - DataFrame内の特定の列の関数の説明(例:how = {col1: fun1, col2: fun2}

  2. fill_method - はffill (別名pad)またはbfill(別名backfill) - 値を前方または後方に塗りつぶします。

1

私は新しい再サンプリング機能についての最もよいまだ文書の部分はwhat's new part for pandas 0.18.0で見つかったかもしれないと思う:

新しいAPI:

さて、あなたは2段階の操作として.resample(..)を書くことができます.groupby(...)であり、これはリサンプラをもたらす。あなたはその後、操作を実行するには、このオブジェクトを使用することができます

をダウンサンプリング

In [82]: r = df.resample('2s') 

In [83]: r 
Out[83]: DatetimeIndexResampler [freq=<2 * Seconds>, axis=0, closed=left, label=left, convention=start, base=0] 

。これらは、ダウンサンプリング動作である(高い周波数から低い周波数へ)。

In [84]: r.mean() 
Out[84]: 
          A   B   C   D 
2010-01-01 09:00:00 0.485748 0.447351 0.357096 0.793615 
2010-01-01 09:00:02 0.820801 0.794317 0.364034 0.531096 
2010-01-01 09:00:04 0.433985 0.314582 0.424104 0.625733 
2010-01-01 09:00:06 0.624988 0.609738 0.633165 0.612452 
2010-01-01 09:00:08 0.510470 0.534317 0.573201 0.806949 
In [85]: r.sum() 
Out[85]: 
          A   B   C   D 
2010-01-01 09:00:00 0.971495 0.894701 0.714192 1.587231 
2010-01-01 09:00:02 1.641602 1.588635 0.728068 1.062191 
2010-01-01 09:00:04 0.867969 0.629165 0.848208 1.251465 
2010-01-01 09:00:06 1.249976 1.219477 1.266330 1.224904 
2010-01-01 09:00:08 1.020940 1.068634 1.146402 1.613897 

さらに、resampleは特定の列に対してリサンプルを実行するgetitem操作をサポートしています。

In [86]: r[['A','C']].mean() 
Out[86]: 
          A   C 
2010-01-01 09:00:00 0.485748 0.357096 
2010-01-01 09:00:02 0.820801 0.364034 
2010-01-01 09:00:04 0.433985 0.424104 
2010-01-01 09:00:06 0.624988 0.633165 
2010-01-01 09:00:08 0.510470 0.573201 
and .aggregate type operations. 

In [87]: r.agg({'A' : 'mean', 'B' : 'sum'}) 
Out[87]: 
          A   B 
2010-01-01 09:00:00 0.485748 0.894701 
2010-01-01 09:00:02 0.820801 1.588635 
2010-01-01 09:00:04 0.433985 0.629165 
2010-01-01 09:00:06 0.624988 1.219477 
2010-01-01 09:00:08 0.510470 1.068634 
These accessors can of course, be combined 

In [88]: r[['A','B']].agg(['mean','sum']) 
Out[88]: 
          A     B   
         mean  sum  mean  sum 
2010-01-01 09:00:00 0.485748 0.971495 0.447351 0.894701 
2010-01-01 09:00:02 0.820801 1.641602 0.794317 1.588635 
2010-01-01 09:00:04 0.433985 0.867969 0.314582 0.629165 
2010-01-01 09:00:06 0.624988 1.249976 0.609738 1.219477 
2010-01-01 09:00:08 0.510470 1.020940 0.534317 1.068634 

結論:

あなたは(リサンプリングDF /シリーズで)リサンプリングした後に何ができるのかという印象を得るために十分に文書.groupby()例を確認することができます