私は1204日にわたって日常的な頻度でタイムセリフを持っています。 私は365Dベースでそれを再サンプリングしたい(合計で)が、時間セリフは365Dの倍数ではなく、3,29 * 365Dで実行されます。 デフォルトでは、resampleは4行を返します。ここでパンダ - 周波数の倍数でない場合のリサンプル?
は、生のデータです:
DATE
2012-08-12 15350.0
2012-08-19 11204.0
2012-08-26 11795.0
2012-09-02 15160.0
2012-09-09 9991.0
2012-09-16 12337.0
2012-09-23 10721.0
2012-09-30 9952.0
2012-10-07 11903.0
2012-10-14 8537.0
...
2015-09-27 14234.0
2015-10-04 17917.0
2015-10-11 13610.0
2015-10-18 8716.0
2015-10-25 15191.0
2015-11-01 8925.0
2015-11-08 13306.0
2015-11-15 8884.0
2015-11-22 11527.0
2015-11-29 6859.0
df.index.max() - df.index.min()
Timedelta('1204 days 00:00:00')
私が適用された場合:
df.resample('365D').sum()
私が得た:
DATE
2012-08-12 536310.0
2013-08-12 555016.0
2014-08-12 569548.0
2015-08-12 245942.0
Freq: 365D, dtype: float64
最後のビンが未満をカバーするものですように思え365日。 resampleを結果から除外するにはどうすればよいですか?
でサンプリングを考慮することができる
はあなたがここにあなたのいくつかの例のデータを置くことができ、それをスキップ? – tworec
コードスニペットとサンプルデータを追加してください。 –
@tworec:例を追加しました。 – Bkyn