2016-04-15 22 views
1

キャレット・パッケージの分類子を使用して列車データをモデル化しようとしていますが、非常に長い時間(2時間待っています)応答しません。一方、他のデータセットに対しても機能します。ここでキャレット・パッケージ・クラシファイアが応答しない

は私の列車のデータへのリンクです:http://www.htmldersleri.org/train.csv(これはよく知られているロイター-21570データセットである)

そして、私が使用しているコマンドは次のとおりです。

model<-train(class~.,data=train,method="knn") 

注:他のためにメソッド(例:svm、naive bayesなど)は、とにかくスタックしています。

注2:パッケージe1071の場合、naiveBayesクラシファイアは動作しますが、精度は0.08%です!

誰でも問題の原因を教えていただけますか?前もって感謝します。

答えて

0

これはマルチクラス分類問題のようです。 caretがそれをサポートしているかどうかはわかりません。 、しかし、私は、あなたがMLRに統合されている学習者を知りたい場合は、

library(mlr) 
x <- read.csv("http://www.htmldersleri.org/train.csv") 
tsk <- makeClassifTask(data = x, target = 'class') 
#Assess the performane with 10-fold cross-validation 
crossval('classif.knn', tsk) 

mlrパッケージと同じことをするだろうか、タスクのこの種をサポートすることをお見せすることができますここではタイプ listLearners(tsk)

+0

"tsk"は私のモデルですね。このモデルをテストデータにどのように適用できますか? predict()は動作していません... – Whcrs

+0

いいえ、 'tsk'はモデルではありません。それは予測タスクの定義です。私の例では、モデルのトレーニングとテストは 'crossval'関数を使って一歩で実行されます。 2つのステップを分けたい場合は、 'mlr'のチュートリアルを読むことをお勧めします:https://mlr-org.github.io/mlr-tutorial/release/html/ –

関連する問題