2017-01-21 4 views
-1

私は時系列でtbatsモデルを訓練するPositiveTBATSという関数を持つ以下のコードを持っています。この関数は、0を0.001に置き換えてログ変換の-inf値を使用しないようにして、時系列にログ変換を適用します。ログの変換は、予測値が負の値を返さないようにすることです。次に、関数を複数の時系列に適用することを並列化する別のコードを用意しました。私が抱えている問題は、予測の上限が常に実際のデータよりも少し低いように見えるということです。私は、より高い予測値を得るのに役立つ可能性のある、tbatsモデルで調整できるパラメータがあるかどうか疑問に思っていました。予測の低い値は実際のデータにかなり近いです。は一貫して低いと予測されています

##Parallelizing TBATS Model Training 

## Making tbats forecast positive 
PositiveTBATS<-function(y){ 
    z<-replace(y,y==0,0.001) 
    x <- log(z) 
    fit <- tbats(x, use.box.cox=FALSE) 
    fit$lambda <- 0 
    fit$control$use.box.cox <- TRUE 
    fc <- forecast(fit,h=20) 
    fc$x <- exp(x) 
    fc 
} 


# Calculate the number of cores 
no_cores <- floor(detectCores()/4) 

# Initiate cluster 
cl <- makeCluster(no_cores) 
clusterEvalQ(cl, library(forecast)) 

tbatsList<-list(mts2DataTs1, mts2DataTs2) 

tbatsModels<-parLapply(cl, tbatsList, 
        PositiveTBATS) 

stopCluster(cl) 


Data: 

dput(mts2DataTs1[1:100]) 
c(50, 48, 47, 41, 33, 24, 23, 24, 25, 31, 36, 48, 56, 68, 79, 
81, 87, 90, 81, 87, 90, 86, 79, 72, 60, 50, 39, 29, 30, 30, 31, 
29, 31, 35, 44, 54, 71, 70, 83, 87, 93, 98, 104, 105, 101, 92, 
94, 83, 76, 66, 64, 55, 48, 42, 38, 33, 34, 36, 47, 51, 58, 65, 
71, 81, 89, 86, 89, 89, 86, 75, 73, 74, 57, 49, 41, 32, 33, 25, 
24, 26, 28, 33, 42, 56, 61, 71, 74, 77, 84, 91, 90, 91, 91, 89, 
93, 90, 79, 66, 66, 48) 


dput(mts2DataTs2[1:100]) 
c(2, 2, 1, 0, 0, 1, 2, 0, 1, 4, 8, 7, 7, 6, 5, 5, 4, 3, 1, 5, 
9, 5, 3, 2, 0, 0, 1, 0, 1, 0, 0, 2, 1, 5, 6, 5, 3, 2, 5, 4, 6, 
5, 3, 4, 2, 5, 2, 1, 0, 4, 1, 2, 2, 2, 1, 1, 2, 1, 2, 7, 7, 3, 
7, 3, 3, 2, 0, 4, 1, 3, 4, 1, 3, 0, 1, 3, 1, 0, 1, 3, 2, 4, 4, 
2, 4, 5, 4, 3, 8, 3, 3, 5, 4, 3, 1, 1, 1, 2, 1, 1) 

答えて

0

データは季節的ですが、TBATS関数呼び出しでは季節を指定していません。また、PositiveTBATS関数の予測部分への逆変換も行いません。

また、ここで提供したシリーズのいずれに対してもログ変換は使用しません。 2番目のシリーズにはトレーニングデータにゼロが多く含まれていますが、ゼロはここでは例外ではありません。負の予測値を必要としない場合は、予測をゼロで切り捨てます。

このようにあなたの機能を変更すれば、あなたが望むことができます。

PositiveTBATS<-function(y){ 
    fit <- tbats(y, seasonal.periods = 24) 
    fc <- forecast(fit,h=20) 
    mean_fc <- pmax(fc$mean,0) 
    return(mean_fc) 
} 
+0

ありがとうございます。私はそれを試みたが、それは予測を改善しなかった。私はそれ以前に言及していませんでしたが、mts2DataTs1 <-msts(na.approx(Datats1)、seasonal.periods = c(24,7 * 24,365 * 24))、それではseasonals.periodsをtbats部分に含める必要があります関数の? – user3476463

+0

クラスを季節のあるmstsに指定した場合は、問題ありません。毎時のデータを扱っているようです。さまざまな頻度でデータを調査し、頻度の異なる予測の調整を行うことを検討することもできます(例:泥棒パッケージを調べる)。 – Julius

関連する問題