2016-05-19 38 views
1

Iはgensim.models.doc2vec.Doc2Vecモデルを訓練し
d2v_model = Doc2Vec(文章、サイズ= 100、ウィンドウ= 8、min_count = 5、労働= 4) 及びIは docvec = d2v_modelによって文書ベクトルを得ることができます。 docvecs [0]gensim Doc2Vecから単語ベクトルを取得するには?

トレーニングされたモデルからどのように単語ベクトルを取得できますか?

答えて

2

Doc2VecがWord2Vecから継承し、したがって、あなたが単語にアクセスすることができ、直接モデルインデックスを付けることで、Word2Vecと同じベクトル:しかし、

wv = d2v_model['apple'] 

注意をその純粋なDBOWようDoc2Vecトレーニングモード(dm=0)単語ベクトルを必要とせず、作成しません。 (純粋なDBOWは、いろいろな目的のためにかなりうまく機能しています!)このようなモデルからワードベクトルにアクセスすると、無作為に自動初期化されたベクトルになります。意味はありません。

DMモード(デフォルトはdm=1)またはDBOW(dm=0, dbow_words=1)にオプションのワードトレーニングを追加する場合のように、Doc2Vecモード自体がワードベクトルを共同トレーニングする場合のみ、ワードベクトルとドキュメントベクトルが同時に学習されます。

関連する問題