2017-09-15 8 views
1

dplyrを使用して複数の項目をまとめようとしています。複数のリターンの時系列があることを考えれば、平均相関を計算したい可能な例)を返します。もちろん(以下の例とは対照的に)私の実際のデータセットはむしろ大きく(まだspread(stock,ret)ではなく)、複数のNAを含んでいます。また、第2のステップでは、私自身の関数を作り、それをrollapplyに供給しなければならないでしょう。したがって、あなたがRCpprollパッケージから何かを使って提案したら、私はもっと幸せになるでしょう!複数の列を基にした複数の列の変更

以下の例では、すべての列を一度に入力したり、ウィンドウを選択したり、すべての列に同時に機能を適用したり、同じ数の列を持つベクトルを受け取ったりする必要があることがわかります。

ここ

は私の例である:私は取得したいと思い何

df <- data.frame(Date =as.Date("1926-01-01")+1:24, 
      PERMNO1 = rnorm(24,0.01,0.3), 
      PERMNO2 = rnorm(24,0.02,0.4), 
      PERMNO2 = rnorm(24,-0.01,0.6)) 
df %>% 
do(rollapplyr(.[,-1],width=12,function(a) colMeans(cor(a)))) 

は次のようなものです:

df2 <- df; df2[,2:4]<-NA 
for (i in 12:24){ 
    df2[i,2:4] <- colMeans(cor(df[(i-12):i,2:4])) 
} 
df2 
    Date PERMNO1 PERMNO2 PERMNO2.1 
1926-01-02   NA  NA  NA 
1926-01-03   NA  NA  NA 
1926-01-04   NA  NA  NA 
1926-01-05   NA  NA  NA 
1926-01-06   NA  NA  NA 
1926-01-07   NA  NA  NA 
1926-01-08   NA  NA  NA 
1926-01-09   NA  NA  NA 
1926-01-10   NA  NA  NA 
1926-01-11   NA  NA  NA 
1926-01-12   NA  NA  NA 
1926-01-13 0.14701350 0.2001694 0.3787320 
1926-01-14 0.15364347 0.2438042 0.3143516 
1926-01-15 0.16118233 0.2549841 0.3266877 
1926-01-16 0.04727533 0.2534126 0.3132990 
1926-01-17 0.05220443 0.2411095 0.2744379 
1926-01-18 0.12252848 0.2461743 0.2766122 
1926-01-19 0.08414717 0.2287705 0.2897744 
1926-01-20 0.11164866 0.2503174 0.2414130 
1926-01-21 0.08886537 0.2604810 0.2621597 
1926-01-22 0.14216304 0.2667540 0.2543573 
1926-01-23 0.12654902 0.3086711 0.2751671 
1926-01-24 0.11068607 0.3019835 0.2728166 
1926-01-25 0.06714698 0.2696828 0.2184242 
+0

質問に表示される出力は、 'set.seed(...) 'なしで乱数が使用されたため再現できません。 –

答えて

1

を実行して、動物園のオブジェクトにデータフレームを変換しますバック変換:

library(dplyr) 
library(zoo) 

df %>% 
    read.zoo %>% 
    rollapplyr(12, function(x) colMeans(cor(x)), by.column = FALSE, fill = NA) %>% 
    fortify.zoo 

をあなただけおそらくデータフレームとして時系列を代表するよりも便利になります動物園のオブジェクトとしての答えを維持したい場合は、最後の行は省略することができます。

関連する問題