私の仕事は、利用可能なタグのリストから文書や投稿にタグ(説明的な単語)を割り当てることです。私はGensimのDoc2vecで作業しています。 doc2vecを文書のタグ付けに使用できることを読んでいます。しかし、私はこのタスクのための適切なパラメータ値を得ることができませんでした。これまで、私は 'size'と 'window'という名前のパラメータの値を変更してテストしました。私が得ている結果はあまりにもナンセンスであり、またこれらのパラメータの値を変更することによって結果に傾向が見いだせません。つまり、一部の値が少し改善され、一部の値が下がってしまいます。誰もがこのタスクのために適切なパラメータ値が何を示唆することができますか?私は十分な訓練データがあれば 'サイズ'(特徴ベクトルならばサイズを定義する)が大きくなければならないことを発見しました。しかし、残りのパラメータについては、私は確信していません!ドキュメントタグ付けのためのDoc2vecのパラメータ値 - Gensim
0
A
答えて
0
どのパラメータが最適なのかは、トレーニングデータのサイズ&のサイズ、およびダウンストリームの目標とまったく同じです。
gensimのデフォルト値は、最初の推測値が妥当か、他の誰かが同様のデータセット/問題で正常に使用したことを確認した値です。
しかし実際には、保持されているテストセットに基づいた自動評価を作成し、Doc2Vec
のパラメータを最適な範囲/組み合わせのパラメータの多くの小さな調整を検索してメタ最適化することによって理想的に実験する必要があります。
関連する問題
- 1. gensim doc2vecのサイズパラメータは、
- 2. Doc2Vec Gensimドキュメントとトピックの類似点
- 3. Gensim Doc2Vec - Doc2Vec関数にコーパス文を渡す
- 4. doc2vec - doc2vec訓練とinfer_vectorのための入力形式()のpython
- 5. gensimのdoc2vec(PV-DM)のドキュメント・ベクトルの更新
- 6. python gensim doc2vecの元の文章を取得するtaggedlinedocument
- 7. GensimパッケージからDoc2Vecの出力を理解する
- 8. Gensim Doc2Vec例外はAttributeError:「str」はオブジェクトが属性の言葉 "
- 9. gensimのDoc2Vec関数の "size"パラメータをどのように解釈すればよいですか?
- 10. Doc2vec Gensim:各エポック中に単語埋め込みが更新されない
- 11. gensim Doc2Vecから単語ベクトルを取得するには?
- 12. gensim 0.11.1でDoc2Vecからドキュメントベクターを取得するには?
- 13. Gensimセグメンテーションフォールト
- 14. gensim doc2vecを分類に使用することは可能ですか
- 15. gensimでpre-trainedモデルを読み込み、doc2vecでトレーニングする方法は?
- 16. Doc2VecモデルPython 3との互換性
- 17. doc2vecモデルの読み込み中にEOFErrorが発生しました
- 18. キー値をコピー/貼り付けするためのelseステートメント
- 19. pythonのパラメータのデフォルト値はargsかkwargsで受け付けられますか?
- 20. 値を見つけるためにAccess VBAのレコードセットを索引付けする
- 21. なぜgensim Doc2Vecは同じ文章に対して私に異なるベクトルを与えるのですか?
- 22. PythonでDoc2Vecの機能を抽出する
- 23. word2vec(gensim)のscore_cbow_pair
- 24. gensimの「docvecs」とは何ですか?
- 25. ストアドプロシージャの複数値の日付パラメータ?
- 26. ランク付けされたアイテムのグループのためのsqliteサブクエリ
- 27. Gensimのデータ解析
- 28. SSIS:参照のための機密パラメータの値へのアクセス
- 29. 別のパラメータの値に基づく条件付きパラメータ
- 30. TeamCityの条件付きパラメータ値