2016-05-02 12 views
1

Word2vecは、deeplearning4jです。私はこのtutorialに続いてコーパスのベクトルを作成しました。deeplearning4j:オンラインWord2Vecトレーニング

ここで問題となるのは、モデルを新しい文で最初から再構築することなく更新する方法です。

この考え方にはいくつかの考えがありますか?

public void trainSentence(List<VocabWord> sentence){} 

モデルを更新しますか?はいの場合、このメソッドに送信する文章を準備する方法は?

答えて

2

はい、いいえ。ドキュメントhereには、次のように記載されています。

モデルのシリアル化/逆シリアル化後の重みの更新が追加されました。 つまり、モデル状態を (loadFullModel)に変更し、TokenizerFactorySentenceIteratorを追加し、リストアされたモデルでfit()を呼び出すことで、モデルの状態を新しいテキストで更新することができます。

これは、モデルの重みを再計算して新しいコーパスで更新できることを意味します。しかし、新しい単語はボキャブに追加されません。

チェックコードとJavadoc here