Rパッケージrpartでは、決定木のCPテーブル内に表示されるツリーのサイズはどのように決定されますか?以下の例では、CPテーブルはデフォルトで、1,2ノード、5ノードのツリーのみを表示します(それぞれnsplit = 0,1,4)。rpartのCPテーブルによって与えられるツリーサイズ
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start, method="class", data=kyphosis)
> printcp(fit)
Classification tree:
rpart(formula = Kyphosis ~ Age + Number + Start, data = kyphosis,
method = "class")
Variables actually used in tree construction:
[1] Age Start
Root node error: 17/81 = 0.20988
n= 81
CP nsplit rel error xerror xstd
1 0.176471 0 1.00000 1.00000 0.21559
2 0.019608 1 0.82353 0.94118 0.21078
3 0.010000 4 0.76471 0.94118 0.21078
提示する木のどのようなサイズを決定するために使用する固有のルールrpart()
はありますか? printcp()
に、ツリーのすべての可能なサイズのクロスバリデーション統計を返すことが可能ですか?つまり、上記の例では、3ノードと4ノードのツリー(nsplit = 2,3)の行も含めますか?
あなたの答えをありがとう、私は 'minsplit'と' cp'は、相互検証を試みる前に、木の成長に使用されるパラメーターであるという印象の下にあった - むしろ後でそれをプルーニングよりも、どのような私であります質問とCPテーブルは参照してください。上記の出力がnsplit = 0、1、4を表示し、 'minsplit'と' cp'の適切な値がnsplit = 0,1,2,3,4という値を提示しているのではないかと誤解していたら、 4? ちなみに、 'summary(fit)'はnsplitのすべての値についてクロスバリデーションの統計情報を与えませんでした。CPテーブルは質問と同じです。 – alopex