私は過去6ヶ月にわたりデータセットのローリング・平均を作成しようとしています。 データは日々のもので、100,000を超える行があり、そこからサンプルを提供しました。観測数の異なるローリング・平均
# A tibble: 100 × 5
ID MONTH DATE VALUE R_MEAN
<fctr> <dbl> <date> <dbl> <dbl>
1 634 20160200 2016-02-03 2 0.000000
2 1700 20150300 2015-03-02 3 0.000000
3 1700 20150400 2015-04-01 7 3.000000
4 1700 20150400 2015-04-09 1 5.000000
5 1700 20150700 2015-07-02 26 3.666667
6 1700 20150800 2015-08-03 1 9.250000
7 1700 20150900 2015-09-01 2 7.600000
8 1700 20151000 2015-10-01 5 7.400000
9 1700 20151000 2015-10-07 10 7.833333
10 1700 20151100 2015-11-02 8 8.800000
# ... with 90 more rows
私の目標は、IDのために、たとえばので、過去6カ月間にわたり移動平均を作成することです:20160101のXおよびDATE値Iは、同じIDを持つすべての行の平均値を取得したいとここでDATE値は20150601〜20160101です。以前の値が利用できない場合、私は平均値をゼロと見なします。
私はある種の拡張グリッドアプローチを使用すると考えましたが、私はID(30,000に近い)が多いため、グリッドを2年間にわたって毎日拡張すると膨大なグリッドになります。
素晴らしい!これはすごくうまくいった! – Michael