pandas resample moduleのドキュメントを検索しました。関数で使用可能なパラメータについては説明していますが、これらのパラメータのオプションを教えてくれるわけではありません。例えば、 how
パラメータは'sum'
の値をとりますが(例に示すように)、他にどのような値がありますか?同様にfill
パラメータの場合。誰も私に教えて/これらのパラメータの利用可能な値へのリンクを提供できますか?パンダのリサンプルオプション
答えて
時系列機能の開始には、おそらくpandas tutorialです。しかし、それはしません。トピックを徹底的にカバーしてください。
また、Cookbookを見ることもできます。ほとんどのリンクが、次の点を指しています。
メソッド引数のテーブルがPython for Data Analysisにあります。あなたが求める2つのパラメータについては
:
how
- (など'sum'
、'mean'
、など)の一般的な機能を示す文字列、配列を取ってカスタム関数とすることができ、 - おそらくそこに記載されていないもの - DataFrame内の特定の列の関数の説明(例:how = {col1: fun1, col2: fun2}
)fill_method
- はffill
(別名pad
)またはbfill
(別名backfill
) - 値を前方または後方に塗りつぶします。
私は新しい再サンプリング機能についての最もよいまだ文書の部分はwhat's new part for pandas 0.18.0で見つかったかもしれないと思う:
新しいAPI:
さて、あなたは2段階の操作として.resample(..)
を書くことができますは.groupby(...)
であり、これはリサンプラをもたらす。あなたはその後、操作を実行するには、このオブジェクトを使用することができます
をダウンサンプリング
In [82]: r = df.resample('2s')
In [83]: r
Out[83]: DatetimeIndexResampler [freq=<2 * Seconds>, axis=0, closed=left, label=left, convention=start, base=0]
。これらは、ダウンサンプリング動作である(高い周波数から低い周波数へ)。
In [84]: r.mean()
Out[84]:
A B C D
2010-01-01 09:00:00 0.485748 0.447351 0.357096 0.793615
2010-01-01 09:00:02 0.820801 0.794317 0.364034 0.531096
2010-01-01 09:00:04 0.433985 0.314582 0.424104 0.625733
2010-01-01 09:00:06 0.624988 0.609738 0.633165 0.612452
2010-01-01 09:00:08 0.510470 0.534317 0.573201 0.806949
In [85]: r.sum()
Out[85]:
A B C D
2010-01-01 09:00:00 0.971495 0.894701 0.714192 1.587231
2010-01-01 09:00:02 1.641602 1.588635 0.728068 1.062191
2010-01-01 09:00:04 0.867969 0.629165 0.848208 1.251465
2010-01-01 09:00:06 1.249976 1.219477 1.266330 1.224904
2010-01-01 09:00:08 1.020940 1.068634 1.146402 1.613897
さらに、resampleは特定の列に対してリサンプルを実行するgetitem操作をサポートしています。
In [86]: r[['A','C']].mean()
Out[86]:
A C
2010-01-01 09:00:00 0.485748 0.357096
2010-01-01 09:00:02 0.820801 0.364034
2010-01-01 09:00:04 0.433985 0.424104
2010-01-01 09:00:06 0.624988 0.633165
2010-01-01 09:00:08 0.510470 0.573201
and .aggregate type operations.
In [87]: r.agg({'A' : 'mean', 'B' : 'sum'})
Out[87]:
A B
2010-01-01 09:00:00 0.485748 0.894701
2010-01-01 09:00:02 0.820801 1.588635
2010-01-01 09:00:04 0.433985 0.629165
2010-01-01 09:00:06 0.624988 1.219477
2010-01-01 09:00:08 0.510470 1.068634
These accessors can of course, be combined
In [88]: r[['A','B']].agg(['mean','sum'])
Out[88]:
A B
mean sum mean sum
2010-01-01 09:00:00 0.485748 0.971495 0.447351 0.894701
2010-01-01 09:00:02 0.820801 1.641602 0.794317 1.588635
2010-01-01 09:00:04 0.433985 0.867969 0.314582 0.629165
2010-01-01 09:00:06 0.624988 1.249976 0.609738 1.219477
2010-01-01 09:00:08 0.510470 1.020940 0.534317 1.068634
結論:
あなたは(リサンプリングDF /シリーズで)リサンプリングした後に何ができるのかという印象を得るために十分に文書.groupby()
例を確認することができます
- 1. パンダ:`
- 2. パンダ:
- 3. パンダ
- 4. パンダ3Dのインポートモジュールエラー
- 5. パンダのサブプロット
- 6. パネルデータのウェイト - パンダ
- 7. パンダのデータフレーム
- 8. パンダのデータフレームマージ
- 9. パンダ:インプットNaNの
- 10. パンダ:データフレームのサンプリング
- 11. はパンダのデータフレーム
- 12. パンダのメモ
- 13. パンダDATAFRAME
- 14. パンダstr.replace
- 15. パンダ:ダミー
- 16. パンダ:列
- 17. パンダのアイテムカテゴリのバーポット
- 18. パンダのデータフレームマルチインデックスのサブインデックス
- 19. パンダ:独自のデータフレーム
- 20. パンダのcomplexby with groupby
- 21. パンダ - マットの割合
- 22. パンダ階層データフレーム
- 23. 逆転、パンダ
- 24. パンダ・グループとマルチインデックス
- 25. 列-パンダDATAFRAME
- 26. ピボットテーブル(?)パンダDATAFRAMEと
- 27. パンダxlsxwriter、フォーマットヘッダ
- 28. パンダ:同じインデックス
- 29. パンダGROUPBYが
- 30. パンダ:問題