私は、複数年にわたる毎時の観測気候データを持つデータフレームを持っています。データ値のn%がposix日付でグループ分けされた変数に存在するかどうかのテスト
dateTime <- seq(as.POSIXct("2012-01-01"),
as.POSIXct("2012-12-31"),
by=(60*60))
WS <- sample(0:20,8761,rep=TRUE)
WD <- sample(0:390,8761,rep=TRUE)
Temp <- sample(0:40,8761,rep=TRUE)
df <- data.frame(dateTime,WS,WD,Temp)
df$WS[WS>15] <- NA
私はDF $ WSは、その月の有効なデータの75%以上を持っている場合見つけるために(月ごと、またはこの例では)年によってグループにする必要があります。私のフィルタリング基準は、0はまだ有効な観測値であるため、NAです。観測気候データなので、私は本当のNAを持っています。これらの私は新しい列「月」でファイラーする%>%の機能を使用して配管するだけでなく、ここに Calculate the percentages of a column in a data frame - "grouped" by column上のいくつかの質問を検討dplyr試してみました
、 Making a data frame of count of NA by variable for multiple data frames in a list、 R group by date, and summarize the values
どれも私を本当に答えませんでした質問。
私の望みは、この基準がその年/駅で満たされていれば、すべての駅と各駅のすべての年を通って風のバラを生み出すループ関数で動作する長いスクリプトに何かを入れることです。もっと明確にする必要がある場合は、私にお知らせください。 乾杯
変数 'Temp'に対して有効なデータはありますか? –
変数は$ WS – Dee