初めてDoc2Vecを使用しています 著者の作品を分類しようとしています。私はLabeled Sentences(段落、または指定された長さの文字列)を持つモデルを訓練しました。words =段落の単語のリスト、およびtags = authorの名前です。私の場合、私は2人の著者しか持たない。 訓練されたモデルからdocvecs属性にアクセスしようとしましたが、モデルを訓練したときの2つのタグに対応する2つの要素しか含まれていません。私は訓練にフィードした各段落のdoc2vec numpy表現を取得しようとしていますので、後でそれを訓練データとして使用できます。これどうやってするの?おかげさまで 各文書の訓練されたDoc2Vecモデルからnumpyベクトルを取得する
0
A
答えて
0
バルクトレーニングは、指定したタグのベクトルのみを作成します。 (model.docvecs['paragraph000']
のように)段落ごとに大量に訓練されたベクトルを読みたい場合は、訓練中に各段落に固有のタグを付ける必要があります('paragraph000'
など)。ドキュメントに他のタグを付けることもできますが、一括トレーニングのみが、提供されたタグのドキュメントベクトルを記憶しています。
トレーニング終了後、infer_vector()
に提供する他のテキストのベクトルを推論することができます。もちろん、トレーニング中に使用されたのと同じ段落を入力することもできます。
関連する問題
- 1. doc2vec用に事前に訓練されたword2vecモデルをロードする
- 2. doc2vec - doc2vec訓練とinfer_vectorのための入力形式()のpython
- 3. Azureマシンスタジオから訓練されたモデルをダウンロードするには?
- 4. 訓練中にmin_countが1に設定されていても、Doc2VecモデルのKeyError
- 5. KeyError例外私は2つの機能を備えたLinearRegressorを訓練している訓練されたモデル
- 6. 訓練されたKerasモデルをロードしてトレーニングを続ける
- 7. Theano/lasagne:訓練されたモデルで予測する方法
- 8. gensim Doc2Vecから単語ベクトルを取得するには?
- 9. Sparkでの訓練されたcrossValidationモデルの読み込み
- 10. 訓練されたSVMをscikit-learnからOpenCVにインポートする
- 11. 単数ではなく複数で訓練されたCRFモデル
- 12. 分類器から訓練特徴名のリストを取得
- 13. CNTK:訓練されたモデルデータへのアクセス
- 14. Mxnetで事前訓練されたモデルのレイヤーを変更する方法
- 15. テンソルフローで事前に訓練されたモデルを復元する際のトラブル
- 16. h2oで訓練されたモデルをJavaコードにエクスポートできますか?
- 17. glmnetで訓練されたモデルから係数を追加するためにlambda.minを使用する
- 18. 訓練されたメタグラフからの重みとバイアス
- 19. 異なる入力で訓練されたモデルを使用する方法
- 20. TensorFlow - 異なるテストデータセットで訓練されたモデルを予測する方法は?
- 21. doc2vec - 文書のベクトルをより速く推論する方法
- 22. Tensorflow:あらかじめ訓練されたVggモデルから変数に定数テンソルを変換する
- 23. モデルによって作成された訓練された重みを得る方法
- 24. Keras訓練されたVGGエラー
- 25. テンソルフロースリム事前訓練されたアレックスネット
- 26. TensorFlowで訓練されたモデルとC APIを使用して予測する
- 27. 既にSKLearnで訓練されたモデルを使用するには?
- 28. Tensorflowでオブジェクト識別に訓練されたCNNモデルを使用する方法
- 29. ニューラルネットワークを訓練するために訓練された画像を変更する
- 30. 既に単語認識のための訓練されたHMMモデル
私は実際にそれを理解し、あなたが言ったように段落番号をタグとして使用しています。 (1著者あたり10000ベクトル)私は両方の著者のためにこれを行い、それとsvmモデル(sklearn)を訓練する。しかし、それらの数字のdocvec配列をベクトルとして使うと、恐ろしい精度を得ます。〜50%。私は73%のnltk pos_tagを持っていますので、何か間違ったことをする必要があります。 –
ありがとうございました。私は私の段落にinfer_vectorを使って、バイナリ分類タスクで93.28%の精度を得ています!! ;) –