I持って、次のデータパンダDATAFRAMEは、最初の発生を見つける
timestamp bucket forward
0 02/01/2012 08:00 1 2309.6
1156 02/01/2012 08:00 2 2305.9
2320 02/01/2012 08:00 3 2306
3481 02/01/2012 08:00 4 2240.9
4643 02/01/2012 08:00 5 2235.3
5807 02/01/2012 08:00 6 2224.1
6969 02/01/2012 08:00 7 2167.1
1 02/01/2012 09:00 1 2327.3
1157 02/01/2012 09:00 2 2323.4
2321 02/01/2012 09:00 3 2323.5
3482 02/01/2012 09:00 4 2258.4
4644 02/01/2012 09:00 5 2252.8
5808 02/01/2012 09:00 6 2241.4
6970 02/01/2012 09:00 7 2183.2
2 02/01/2012 10:00 1 2342.3
もしバケツ> previouバケツ、私はつまり、同じタイムスタンプに対応する前方を見つける必要があります。
timestamp bucket forward result
0 02/01/2012 08:00 1 2309.6 2309.6
1156 02/01/2012 08:00 2 2305.9 2309.6
2320 02/01/2012 08:00 3 2306 2309.6
3481 02/01/2012 08:00 4 2240.9 2309.6
4643 02/01/2012 08:00 5 2235.3 2309.6
5807 02/01/2012 08:00 6 2224.1 2309.6
6969 02/01/2012 08:00 7 2167.1 2309.6
1 02/01/2012 09:00 1 2327.3 2327.3
1157 02/01/2012 09:00 2 2323.4 2327.3
2321 02/01/2012 09:00 3 2323.5 2327.3
3482 02/01/2012 09:00 4 2258.4 2327.3
4644 02/01/2012 09:00 5 2252.8 2327.3
5808 02/01/2012 09:00 6 2241.4 2327.3
6970 02/01/2012 09:00 7 2183.2 2327.3
2 02/01/2012 10:00 1 2342.3 2342.3
これまでのところ私が持っている:バケット部分の最初のoccuranceを組み込む方法
df['result'] = np.where(df['bucket'].diff()>0, df['forward'].shift(1), df['forward'])
わかりません。任意のポインタは、あなたがdiff
とcumsum
とバケット列からグループ変数を作成し、変換と、各グループから前進1の値を取ることができ