0
R
でcaret
パッケージを使用しています。一部の監視対象の多変量解析に使用しています。私は、スクリプトが実行されるたびに再現可能な結果を可能にするスクリプトにいくつかの機能を追加しようとしています。再現性のある結果/結果を伴うキャレット
は、私が(各モデルにはないenesmbleとして、個別に実行される)2つの分類モデルを使用するため、この設定を持っている:
このパイプラインで得るために、私はset.seed(#)
を使用する必要がありますし、
#
何をする必要があります
library(caret)
load.data = ....
cleaned.data = cleaning(load.data)
mycontrol = trainControl(...)
train, test = createDatapartition(...)
model1 = train(...,
data=train, ...,
trControl=mycontrol,
preprocess=c('center'))
model2 = train(...,
data=train, ...,
trControl=mycontrol,
preprocess=c('pca'))
feature.importances = ...
summary(resamples(list(m1=model1,m2=model2)))
learing_curve_dat(...) #see link 1. below.
predict()
Evaluate(....) #see link 2. below
スクリプトが実行されるたびに再現性のある結果が得られますか、またはランダムに#
の値を選択するだけですか?
リンク: