2016-07-28 8 views
1

リサンプリングに必要なデータポイントの最小数は必要ですか?

df2=df2.resample('D',how="mean",label="left",closed="left") 

は、その平均値を補うためにポイントの一定数(10言う)を必要とするというように、それを作るための方法はあります。 NaNが存在しない場合はその日

データセットは次のようになります。

2004-02-27 20:00:00,2.5666666666666678,0.8638333333333333,,,,,,,,2.5666666666666678,,,,,,4.9,1.0,1.0,1.9088083333333328,0.0214,2.218625,0.0214,246.66666666666663,9.866666666666667,0.0,1.0,1.0 
2004-02-27 21:00:00,8.216666666666667,0.95425,,,,,,,,8.216666666666667,,,,,,4.9,1.0,1.0,1.909341666666667,0.0214,2.2172416666666668,0.0214,251.91666666666663,11.308333333333335,0.0,1.0,1.0 
2004-02-27 22:00:00,5.116666666666666,0.9855,,,,,,,,5.116666666666666,,,,,,4.9,1.0,1.0,1.9110833333333337,0.0214,2.2185916666666663,0.0214,257.1666666666667,12.54166666666667,0.0,1.0,1.0 

答えて

0

あなたは十分なデータポイントが存在する場所を示していますブールマスクを作成することができます。

enough_points = df2.resample("D", label="left", closed="left").count() >= 10

次に手段を算出し、マスクを用いてそれらをフィルタ。

means = df2.resample("D", label="left", closed="left").mean()
good_means = means[enough_points]

関連する問題