私は300ディメンションのgeinsimで訓練されたword2vecモデルを持っており、ディメンションを100にカットしたい(最後の200ディメンションを削除する)。 Pythonを使用する最も簡単で効率的な方法は何ですか?Gensim Word2Vecモデル:カットディメンション
0
A
答えて
1
word2vec formatに出力モデルを保存することができます。テキストファイル(.txt)として保存してください。 word2vec形式は次のとおりです
先頭行は<vocabulary_size> <embedding_size>
です。あなたの場合、<embedding_size>
は300
になります。 残りの行は<word><TAB><300 floating point numbers space separated>
になります。これで、Pythonでこのファイルを簡単に解析し、各行から最後の200個の浮動小数点を捨てることができます。最初の行にある<embedding_size>
を更新してください。これを新しいファイルとして保存します(オプション)。 load_word2vec_format()を使用して、新しいファイルを新鮮なword2vecモデルとして読み込むことができます。
これが問題を解決する場合は、どうぞご了承ください。
関連する問題
- 1. Gensim word2vecオンライントレーニング
- 2. word2vec(gensim)のscore_cbow_pair
- 3. Gensim word2vecの出力は
- 4. gensim Word2vecモデルをバイナリ形式で保存します.bin with save_word2vec_format
- 5. python3のGensim word2vecがありません。
- 6. gensim word2vec in/out vectorへのアクセス
- 7. gensim word2vec:語彙の単語数を確認する
- 8. gensimから否定的なWord2Vec類似性を解釈する
- 9. マッピングのあるgensim Word2Vec単語の名前変更
- 10. あらかじめ定義された辞書と単語インデックスデータのGensim word2vec
- 11. gensimから作成したword2vecでtsneを実行するには?
- 12. どのようにアラビア語/ペルシャ語の言語のgensimと列車word2vec
- 13. Gensim:Doc2Vecモデリングでは、以前のword2vecモデル
- 14. (「/ tmpに/ text8」)gensim
- 15. doc2vec用に事前に訓練されたword2vecモデルをロードする
- 16. 2つのgensimフレーズモデルをマージする
- 17. バークモードでspark word2vecモデルを訓練することは可能ですか?
- 18. Gensimセグメンテーションフォールト
- 19. Gensim LDAモデルの収束を監視する方法は?
- 20. gensimでpre-trainedモデルを読み込み、doc2vecでトレーニングする方法は?
- 21. gensim word2vecで出力埋め込み(出力ベクトル)にアクセスするにはどうすればよいですか?
- 22. Gensim Word2VecがCコンパイラを使用しているかどうかはどうすればわかりますか?
- 23. テンソルフローのword2vecモデルに特定の単語を与える方法
- 24. Pythonでword2vecモデルの精度を計算する
- 25. gensimの「docvecs」とは何ですか?
- 26. テンソルフローでは、word2vecモデルを実行しているときに文で区切る方法は?
- 27. PythonでWord2Vecを実行する際のエラー
- 28. 製品は、私は次のコード、Kerasと負のサンプリングでWord2Vec CBOWを実装しようとしていますWord2Vecモデル
- 29. gensimから重み行列を取得する2Vec
- 30. deeplearning4j:オンラインWord2Vecトレーニング