2016-12-08 28 views
-2

これらのコードは何を意味していますか?機械学習udacity

あなたは私に説明することができます:機械学習開発で

features_train, labels_train, features_test, labels_test = makeTerrainData() 
def submitAccuracy(): 
    return acc 

答えて

1

を追加検証セット電車/テスト・セットに、可能ならば、あなたの利用可能なデータを分割したいです。これを行うと、過度の適合をテストし、モデルが目に見えないように一般化できることを確認します。最終的な検証セットは、知らないとユーザーがテストパーティションの精度でパラメータを最適化しようとすることが多く、基本的にはそのデータのモデルにヒントを与えるため、有用なことがよくあります。検証セットは、これが発生しておらず、モデルが過密でないことをテストするのに便利です。

train_featuresは列車パーティション内でモデルを開発するために使用されている実際のデータに対応している可能性が高いです。ラベルは、予測しようとしているカテゴリです。

テストパーティションは、使用可能なデータのランダムなサンプルです。機能/ラベルは上記と同じです。

トレーニングデータからモデルを作成し、テストパーティションの精度を評価したいとします。

Sebastian Rasckaは、Pythonでの機械学習のすばらしい概要を提供します。コードサンプルといくつかの説明はhttps://github.com/rasbt/python-machine-learning-book/tree/master/code

にあります。