2017-12-20 13 views
0

与えます。gensim doc2vecは、私がgensim PythonライブラリにDoc2Vecモデルを使用しています非決定結果

私は、同じ文章データでモデルをフィードし、パラメータを設定します:Doc2Vecのシードを固定数に設定すると、モデルの作成後にモデルが異なるベクトルになります。

は、テストの目的のために、私は変わらず、入力データを与えたたびに判定結果を必要としています。私は多くを検索し、gensimの結果を変更しない方法を見つけません。

は、私はそれを使用する方法で、何か問題はありますか?事前に返信いただきありがとうございます。ここで

は私のコードです:

from gensim.models.doc2vec import Doc2Vec 
model = Doc2Vec(sentences, dm=1, dm_concat=1, size=100, window=5, hs=0, min_count=10, seed=64) 
result = model.docvecs 
+0

関連コードを追加してください。 –

+1

@Konafets私はそれを追加しました。 – cramer

答えて

1

Doc2Vecアルゴリズムは、初期化とトレーニングの両方にランダム性を利用して、mutlipleスレッド間のバッチは、必ずしも訓練を受けたことはありませんので、効率的なマルチスレッドのトレーニングは、よりランダム性を紹介しますrun-to-runから同じ順序で実行します。モデルが良く訓練されている場合は

、ラン・ツー・ランの結果のジッタが大きくてはならない、と下流の評価の質があまり変化しないようにしてください。クオリティ・オブ・結果は、多くの異なるない場合は、お使いのデータや訓練へのアルゴリズムの適用と可能性の高い他の問題があります。

これとは別に、デフォルト以外のdm_concat=1モードを使用することはほとんどありません。それははるかに大きく、はるかに遅いツー電車のモデルになり、そしてそれはその余分なコストの価値があることの明確な公共例がありません。 (私はより単純なモード、多くのデータと時間からの強いベースライン結果を持っていれば私はそれを試してみたい)

+0

あなたの答えには大変感謝しています。 :) – cramer

関連する問題