4

現在、畳み込みニューラルネットワークについては、MNISTの例のような例を勉強して学習しています。誰かが私に、各列が表す、値が何を意味するのまさに上の説明を与えることができ、エポックほかNNの電車損失、有効損失、電車/電車平均とは何ですか?

Epoch | Train loss | Valid loss | Train/Val 
--------|--------------|--------------|--------------- 
    50 | 0.004756 | 0.007043 |  0.675330 
    100 | 0.004440 | 0.005321 |  0.834432 
    250 | 0.003974 | 0.003928 |  1.011598 
    500 | 0.002574 | 0.002347 |  1.096366 
    1000 | 0.001861 | 0.001613 |  1.153796 
    1500 | 0.001558 | 0.001372 |  1.135849 
    2000 | 0.001409 | 0.0|  1.144821 
    2500 | 0.001295 | 0.001146 |  1.130188 
    3000 | 0.001195 | 0.001087 |  1.099271 

:?ニューラルネットワークの訓練中に、私はしばしばのような出力を参照してください私は基本的なcnnのチュートリアルをたくさん見ていますが、私はこれを詳細に説明していません。

答えて

6

ネットワークのトレーニングに使用されているデータに加えて、保持されているデータセットが使用されているようです。トレーニング損失は、トレーニングデータセットのエラーです。検証喪失は、訓練されたネットワークを介して検証データセットを実行した後のエラーです。 Train/validは両者の比率です。

予期せず、検証と訓練の両方のエラーが低下します。しかし、ある時点では、トレーニングエラーが低下し続けている間に(ネットワークがデータをより良く、より良く学習する)、検証エラーが上昇し始めます。これはoverfittingです!