私は181サンプルと10個のフィーチャと1つのターゲット変数で構成されるデータセットを持っています。 10の機能は数値で連続的な性質を持っています。バイナリ分類を実行する必要があります。私は、データセットのこのサイズのために最適なモデルを選択して、私のモデルが過剰適合されていないことを確認してください可能性がどのように私を導いてください小さなデータセット<200サンプルのバイナリ分類
I have performed 3 Fold cross validation and got following accuracy results using various models:-
LinearSVC:
0.873
DecisionTreeClassifier:
0.840
Gaussian Naive Bayes:
0.845
Logistic Regression:
0.867
Gradient Boosting Classifier
0.867
Support vector classifier rbf:
0.818
Random forest:
0.867
K-nearest-neighbors:
0.823
- :私は、次の作業を行っていますか?私はsklearnの地図からの手順に従っていますhttp://scikit-learn.org/stable/tutorial/machine_learning_map/
これはプログラミングに関するものではありません。 [cross-validated](http://stats.stackexchange.com/)または[data science](http://datascience.stackexchange.com/)に投稿してみてください。 – gobrewers14