私はsqueeze net紙を読んでから、この質問に出くわしました。著者は、事前に訓練されたモデルを圧縮するためにDeep Compressionを使用すると述べています。アルゴリズムなどcaffeモデル動物園のような、事前に訓練されたモデルにどのようなデータが保存されていますか?
ハフマンコードが含まれて私は事前に訓練推測は、すべてのパラメータであり、ネットワークを訓練するとき、私は、これらのパラメータが生成されている知っていますが、私はパラメータがどのように生成されるかわかりません。予測を行うときに、事前に訓練されたモデルのパラメータはどのような役割を果たすのですか?
それは
あなたは私が検索することができますいくつかの論文やキーワードに名前を付けることはできますか?私は、関連トピックを見つけることができますキーワードのどのような種類がわからない。( –
(1)オフサイトのリソースは、スタックオーバーフローの範囲を超えている(2)あなたがここに学ぶために何をしようとしているあなたがに慣れていないなら。? CNNの動作を確認し、前方 - 後方伝播を含むニューラルネットワークの紹介を探します。 – Prune