訓練されたKerasモデルをロードしてトレーニングを続ける

訓練されたKerasモデルを一部保存して、モデルを再度ロードした後にトレーニングを続けることが可能かどうか疑問に思っていました。訓練されたKerasモデルをロードしてトレーニングを続ける

これは、将来的にはトレーニングデータが増え、モデル全体を再トレーニングしたくないからです。

私が使用していな機能は以下のとおりです。

#Partly train model 
model.fit(first_training, first_classes, batch_size=32, nb_epoch=20) 

#Save partly trained model 
model.save('partly_trained.h5') 

#Load partly trained model 
from keras.models import load_model 
model = load_model('partly_trained.h5') 

#Continue training 
model.fit(second_training, second_classes, batch_size=32, nb_epoch=20)

編集1：最後のエポックの損失がなる10のエポックの後の最初のデータセットで

完全に動作する例を追加しました0.0748、精度は0.9863です。

モデルを保存、削除、再読み込みした後、2番目のデータセットで訓練されたモデルの損失と精度は、それぞれ0.1711と0.9504になります。

これは、新しいトレーニングデータまたは完全に再訓練されたモデルによるものですか？

""" 
Model by: http://machinelearningmastery.com/ 
""" 
# load (downloaded if needed) the MNIST dataset 
import numpy 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense 
from keras.utils import np_utils 
from keras.models import load_model 
numpy.random.seed(7) 

def baseline_model(): 
    model = Sequential() 
    model.add(Dense(num_pixels, input_dim=num_pixels, init='normal', activation='relu')) 
    model.add(Dense(num_classes, init='normal', activation='softmax')) 
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) 
    return model 

if __name__ == '__main__': 
    # load data 
    (X_train, y_train), (X_test, y_test) = mnist.load_data() 

    # flatten 28*28 images to a 784 vector for each image 
    num_pixels = X_train.shape[1] * X_train.shape[2] 
    X_train = X_train.reshape(X_train.shape[0], num_pixels).astype('float32') 
    X_test = X_test.reshape(X_test.shape[0], num_pixels).astype('float32') 
    # normalize inputs from 0-255 to 0-1 
    X_train = X_train/255 
    X_test = X_test/255 
    # one hot encode outputs 
    y_train = np_utils.to_categorical(y_train) 
    y_test = np_utils.to_categorical(y_test) 
    num_classes = y_test.shape[1] 

    # build the model 
    model = baseline_model() 

    #Partly train model 
    dataset1_x = X_train[:3000] 
    dataset1_y = y_train[:3000] 
    model.fit(dataset1_x, dataset1_y, nb_epoch=10, batch_size=200, verbose=2) 

    # Final evaluation of the model 
    scores = model.evaluate(X_test, y_test, verbose=0) 
    print("Baseline Error: %.2f%%" % (100-scores[1]*100)) 

    #Save partly trained model 
    model.save('partly_trained.h5') 
    del model 

    #Reload model 
    model = load_model('partly_trained.h5') 

    #Continue training 
    dataset2_x = X_train[3000:] 
    dataset2_y = y_train[3000:] 
    model.fit(dataset2_x, dataset2_y, nb_epoch=10, batch_size=200, verbose=2) 
    scores = model.evaluate(X_test, y_test, verbose=0) 
    print("Baseline Error: %.2f%%" % (100-scores[1]*100))

出典

2017-03-08 Wilmar van Ommeren

テストしましたか？私はそれが働かない理由はないと思う。 – maz

私が今見ているのは、モデルを読み込んだ後の精度が約10％低下することです（最初のエポックでのみ）。再ロードが機能する場合、これはもちろん新しいトレーニングデータによって引き起こされます。しかし、私はちょうどこれが本当に事実であることを確実にしたい。 –

モデルをmodel.saveに直接保存しているのですか、モデルチェックポイント（https://keras.io/callbacks/#example-model-checkpoints）を使用していますか？ model.saveを使用している場合は、最新のモデル（つまり、最後のエポック）を最良のもの（最低エラー）ではなく保存する可能性はありますか？実際のコードを提供できますか？ – maz

実際には、model.saveは、トレーニングを再開するためのすべての情報を必要に応じて保存します。モデルをリロードして損をする可能性があるのは、オプティマイザの状態だけです。それを確認するには - saveを試してモデルをリロードし、トレーニングデータでトレーニングします。

出典

2017-03-08 11:45:28

@Marcin：ケラス 'save（）'を使用すると、モデルの最良の結果（最低損失）またはモデルの最終結果（最終更新）が保存されますか？ありがとうございました –

最終更新。モデルチェックポイントコールバックは、最良のものを保存するためのものです。 – Khaj

ケラスには、hereのように、読み込みモデルに問題があることがあります。これは、同じ訓練された精度から開始しない場合を説明します。

出典

2017-07-26 08:42:45

-1

異なるオプティマイザを使用しているか、オプティマイザに異なる引数を使用している可能性があります。私は、元の学習率は0.0003で始まり、事前にトレーニング中にそれは0.000003

あるmin_learning率に低減されるpretrainedモデル、のために

reduce_lr = ReduceLROnPlateau(monitor='loss', factor=lr_reduction_factor, 
           patience=patience, min_lr=min_lr, verbose=1)

を使用して、カスタムpretrainedモデルと同じ問題を持っていました

私は、あらかじめ訓練されたモデルを使用し、実際には不正確さを持つスクリプトにその行をコピーしました。私は、事前学習モデルの最後の学習率が最小学習率、すなわち0.000003であることに気付くまで、その学習率から始めれば、事前訓練されたモデルの出力と同じ正確さが得られます。これは、事前訓練されたモデルで使用された最後の学習率の100倍の学習率から始まりますモデルはGDの巨大なオーバーシュートをもたらし、ひいては大幅に減少した精度になる。

出典

2017-12-28 15:53:37 Wolfgang

訓練されたKerasモデルをロードしてトレーニングを続ける

答えて

関連する問題