私は既に訓練を受けた準備ができているword2vecモデルを持っています。私は、CSVファイルとして連載している:私が知りたいのですがどのようなgensimでpre-trainedモデルを読み込み、doc2vecでトレーニングする方法は?
word, v0, v1, ..., vN
house, 0.1234, 0.4567, ..., 0.3461
car, 0.456, 0.677, ..., 0.3461
は、私がgensim
でその単語のベクトルモデルをロードし、段落またはdoc2vecモデルを訓練するためにそれを使用する方法です。
このDoc2Vec tutorialは、「# C text format
」の形式でモデルを読み込むことができますが、実際にはどういう意味かわかりません。最初は「Cのテキスト形式」ですが、もっと重要なのは
- 私はword2vecモデルを読み込んでdoc2vecトレーニングに使用できますか?
word2vecモデルから語彙を構築するにはどうすればよいですか?
私はこのステートメントを証明することはできませんが、事前に訓練された単語ベクトルを提供する場合、ドキュメントベクタがうまく機能すると思います。私は交差部分をコメントアウトしてテストし、結果を比較しました。しかし、答えを提供していただきありがとうございます:) – displayname
どのくらいのデータで、どのようなタスクでよりうまくいくか、事前に訓練されたベクトル? – gojomo