hereで働いていますがこれまでのところ私は、誰もがよりよい解決策を知っている場合、私に知らせて、これを思い付きました。 データセットをターゲット列で分割した後、それぞれの2つの分割を最初の70%、次の20%、最後の10%のデータに分割して結合しました。 その後、フィーチャーとターゲットを分割しました。
%split in 0/1 samples
winedataset_0 = winedataset(winedataset(:, 13) == 0, :);
winedataset_1 = winedataset(winedataset(:, 13) == 1, :);
%train
split_tr_0 = round(length(winedataset_0)*0.7);
split_tr_1 = round(length(winedataset_1)*0.7);
train_0 = winedataset_0(1:split_tr_0,:);
train_1 = winedataset_1(1:split_tr_1,:);
train_set = vertcat(train_0, train_1);
train_set = train_set(randperm(length(train_set)),:);
%valid
split_valid_0 = split_tr_0 + round(length(winedataset_0)*0.2);
split_valid_1 = split_tr_1 + round(length(winedataset_1)*0.2);
valid_0 = winedataset_0(split_tr_0+1:split_valid_0,:);
valid_1 = winedataset_1(split_tr_1+1:split_valid_1,:);
valid_set = vertcat(valid_0, valid_1);
valid_set = valid_set(randperm(length(valid_set)),:);
%test
test_0 = winedataset_0(split_valid_0+1:end,:);
test_1 = winedataset_1(split_valid_1+1:end,:);
test_set = vertcat(test_0, test_1);
test_set = test_set(randperm(length(test_set)),:);
%Split into X and y
X_train = train_set(:,1:12);
y_train = train_set(:,13);
X_valid = valid_set(:,1:12);
y_valid = valid_set(:,13);
X_test = test_set(:,1:12);
y_test = test_set(:,13);
内蔵の 'crossvalind'関数のドキュメントを見てください。あなたは(例えば)10倍を生成することができ、そのうちの7つをトレーニングに、2つを検証に、そして1つをテストに使用することができます。 –
私はそれを見ました。確かに良いアイデア。しかし、 'crossvalind'は、ターゲットの列に比例しますか? – HonzaB
私は99%あなたがこのオプションを与えることができると確信しています。ドキュメントを見て.. –