0
私はdoc2vecを約100万タイトルのコーパスで使用しています。コーパスを訓練するために、私は次のコードを使用しています:訓練中にmin_countが1に設定されていても、Doc2VecモデルのKeyError
model = gensim.models.Doc2Vec(min_count=1, window=10, size=300, workers=4)
model.build_vocab(corpus)
for epoch in range(10):
model.train(corpus)
すべてが適切に訓練しているようだと私はtitles.most_similarを使用してベクトルを推測することができています。
しかし、私はベクトルを使用しようとすると問題が発生します。最終的なモデルからいくつかの文書が欠落しているようです!すなわち:
model.docvecs['SENT_157000']
は私がgensimフォーラムやstackoverflowのを確認し、私は見つけることができる唯一の提案はmin_count = 1。私はそれをしたことを確実にするためだったが、私はまだこの問題を抱えています。KeyError: 'SENT_157000'