word2vec

0熱

1答えて

私はword2vecモデルを持っていて、すべての単語を列車とテストセットに埋め込むために使用します。しかし、適切な言葉では、word2vecモデルには含まれていません。そして、すべての適切な単語の埋め込みとしてベクトルをランダム化できますか？できる場合は、私にいくつかのヒントといくつかの論文を参考にしてください。ありがとうございます

-1熱

1答えて

機械学習用の電子メールデータセットを使用する際に電子メールヘッダーを無視する必要がありますか？

私は機械学習のための電子メールデータセットを見ており、電子メールには電子メールコンテンツに加えてヘッダー情報が含まれていることに気づいています。メールの内容を無視したり、ヘッダーをスキップしたりするのが最善でしょうか？または、ヘッダーを含める必要がありますか？これはあなたがしようとしていることに依存していますか？ Word2Vecのトレーニングでは、ヘッダーを使用する必要がありますか？電子メール

0熱

1答えて

負荷事前訓練されたワード埋め込み

私はGoogleのニュース model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) print (model.wv.vocab) から事前に訓練された単語の埋め込みをロードしたい。しかし、エラーが表示されている： UnicodeEnco

0熱

1答えて

日記エントリのセンチメント分析のデータセット

センチメントラベルの日記エントリのデータセットがあるかどうか疑問に思っていましたか？私が探しているのは、日記のエントリの表と、エントリが「正」か「負」か（さらにはより多くのカテゴリに分類されているか）を少なくとも示す表です。例（完全任意）： "今日床が凍ったが、私が滑って落ちた私は氷を憎みます。。" =>ラベル：「負」「！！私は私の友人を愛する彼らは私のためにサプライズパーティーを主催し、」

0熱

2答えて

単語Xで発生する可能性のある単語を見つける

単語Xの近くでどの単語が頻繁に出ているかを調べる最良の方法は何ですか？（注：どの単語が単語Xに最も類似しているのかわからない）私はGloVe単語ベクトルを持っているので、各ベクトルは異なる環境（各次元は環境です）にある単語の分布を表します。だから私はどのようにそれらの環境のそれぞれから単語を取得するのですか？言い換えれば、どの次元で似ている単語を検索するには？私は一次元に沿ってXに近い単語を

1熱

1答えて

gensim - Word2vecオンライントレーニング - AttributeError： 'Word2Vec'オブジェクトには属性がありません 'model_trimmed_post_training

私は事前に訓練されたモデルを使用して、それに追加の語彙を追加しようとしています。私はそれに文の1列のcsvファイルを持っています。 import gensim existing_model_fr = gensim.models.Word2Vec.load('./fr/fr.bin') new_sentences = gensim.models.word2vec.LineSentence('

0熱

1答えて

特定のコンテキストファイルでword2vecビルドを評価する方法

gensim word2vecを使用して、名前付きエンティティ認識問題で単語をベクトルとして表現するための一連の訴訟ファイルを組み込んだCBOWモデルを構築しましたが、私の言葉の表現。私がwordsim353（NLTK）やGoogleの他のオンラインデータセットのような他のデータセットを使用すると、ファイルの自分のドメインデータセットに固有のモデルを構築したため、動作しません。 word2vecの

1熱

1答えて

word2vecを使用して最も近い関連単語を見つける

私の目標は、word2vecを使用してキーワードのセットで最も関連性の高い単語を見つけることです。たとえば、単語が[girl, kite, beach]の場合、word2vecから関連語を出力したいとします。[flying, swimming, swimsuit...] 私はword2vecがサラウンド単語の文脈に基づいて単語をベクトル化することを理解しています。だから私は何をしたか、次の関数を使

0熱

1答えて

gensim：KeyError例外：「言葉は語彙に『速い』ではない」

私は以下のコードを実行していますが、gensim word2vecは語彙エラーでない言葉を投げています。あなたは私に解決策を教えてもらえますか？ import logging logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) sentences = [["Th

0熱

1答えて

カスタムWord2Vecを使用して、技術的な質問間の意味的類似性を見つけることができますか？

"SIF Embeddings"を適用してGoogleニュースベクターを使用して、 "男の子はサッカーをしています"と "子供はサッカーをしています"のような2つの文章の類似性を得ることができます。私のような技術的なもの2つの文の類似取得したいと思い、「抽象クラスは何を？」 "クラスとは何ですか？" 類似性を得るためにGoogleニュースのベクターを使用しましたが、うまく機能しませんでした。ト