1

doc2vec表現とscikit-learnモデルを使ってテキスト文書を分類したいと思っています。doc2vec表現を使ったscikit-learn分類

私の問題は、どうやって始めればいいのですか?誰かがscikit-learnでdoc2vecを使用するために通常取られる一般的な手順を説明できますか?

答えて

1

scikit-learn + doc2vecを使用したバイナリ分類のためのチュートリアルhereがあります。要約:

  • doc2vecモデルのトレーニング/ロードにgensimを使用してください。
  • 入力テキストは、float(埋め込みと同じ次元)の固定寸法ベクトルに変換されます。これらは実際の入力機能です。
  • scikit-learnに任意の分類子を使用してください。
関連する問題