2016-08-14 7 views
0

私はSVM分類器を訓練するためにC(コストパラメータ)の最良の値を探しています。以下は私のコードです:SVM分類器を訓練している間に行動が変化する

clear all; close all; clc 

% Load training features and labels 
[y, x] = libsvmread('training_data.train'); %the training dataset is named training_data.train 


cost=[2^-7,2^-5,2^-3,2^-1,2^1,2^3,2^5,2^7,2^9,2^11,2^13,2^15]; 
accuracy=zeros(1,length(cost)); %This array will store the accuracy values corresponding to each element in the cost array 

for i = 1:length(cost) 
    opt = sprintf('-c %i -v 3',cost(i)); 
    accuracy(i)=svmtrain(y,x,opt); 
end 

accuracy 

私はLIBSVMライブラリを使用しています。私はこのプログラムを実行すると、精度アレイはかなり奇妙な値が取り込まれる。を通して

67.335 93.696 91.404 92.550 93.696 93.553 93.553 93.553

列9:

列1〜8:ここ が出力されます12:

93.553 93.553 93.553 93.553

これは私が2^-5で最高クロスバリデーション精度を得ることを意味します。私はCの最高値に対して最高の精度を得るべきですか? (私が理解する限り、それは誤分類のペナルティ要因です)。この動作は期待されていますか? (私はUCI MLデータベースを使用して乳がんの識別のための分類器を構築しています)。

答えて

1

Cの最高値で最高精度を得るべきですか? (私が理解する限り、それは誤分類のペナルティ要因です)。

はありません、SVMコストが精度ベースではないとして、それだけでおおよその精度と同じように動作し、特定の代理機能を使用しますが、多くのランダムな変動を期待することができ、保証はありません。一般的には、高いCの値は高いと予想されますが、一般的には高い値である必要はありません。

この動作は予期されていますか? (私はUCI MLデータベースを使用して乳がんの識別のための分類器を構築しています)。

はい、可能な結果です。

+0

答えをありがとう。私はスタックオーバーフローに新しいので、私はあなたの答えをupvoteすることはできません。しかし、それはそれにもかかわらず助けになりました。 –

+1

@PrashantPandeyあなたの質問に答えるならば、あなたは彼の答えを受け入れるべきです(これはSOスコアにもかかわらず常に可能です)。 – sascha

+0

完了しました。先端に感謝します。 –

関連する問題