word2vec

    0

    1答えて

    私はword2vecモデルを持っていて、すべての単語を列車とテストセットに埋め込むために使用します。しかし、適切な言葉では、word2vecモデルには含まれていません。そして、すべての適切な単語の埋め込みとしてベクトルをランダム化できますか? できる場合は、私にいくつかのヒントといくつかの論文を参考にしてください。 ありがとうございます

    -1

    1答えて

    私は機械学習のための電子メールデータセットを見ており、電子メールには電子メールコンテンツに加えてヘッダー情報が含まれていることに気づいています。メールの内容を無視したり、ヘッダーをスキップしたりするのが最善でしょうか?または、ヘッダーを含める必要がありますか?これはあなたがしようとしていることに依存していますか? Word2Vecのトレーニングでは、ヘッダーを使用する必要がありますか? 電子メール

    0

    1答えて

    私はGoogleのニュース model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) print (model.wv.vocab) から事前に訓練された単語の埋め込みをロードしたい。しかし、エラーが表示されている: UnicodeEnco

    0

    1答えて

    センチメントラベルの日記エントリのデータセットがあるかどうか疑問に思っていましたか?私が探しているのは、日記のエントリの表と、エントリが「正」か「負」か(さらにはより多くのカテゴリに分類されているか)を少なくとも示す表です。 例(完全任意): "今日床が凍ったが、私が滑って落ちた私は氷を憎みます。。" =>ラベル: 「負」「!!私は私の友人を愛する彼らは私 のためにサプライズパーティーを主催し、」

    0

    2答えて

    単語Xの近くでどの単語が頻繁に出ているかを調べる最良の方法は何ですか? (注:どの単語が単語Xに最も類似しているのかわからない) 私はGloVe単語ベクトルを持っているので、各ベクトルは異なる環境(各次元は環境です)にある単語の分布を表します。だから私はどのようにそれらの環境のそれぞれから単語を取得するのですか?言い換えれば、どの次元で似ている単語を検索するには? 私は一次元に沿ってXに近い単語を

    1

    1答えて

    私は事前に訓練されたモデルを使用して、それに追加の語彙を追加しようとしています。私はそれに文の1列のcsvファイルを持っています。 import gensim existing_model_fr = gensim.models.Word2Vec.load('./fr/fr.bin') new_sentences = gensim.models.word2vec.LineSentence('

    0

    1答えて

    gensim word2vecを使用して、名前付きエンティティ認識問題で単語をベクトルとして表現するための一連の訴訟ファイルを組み込んだCBOWモデルを構築しましたが、私の言葉の表現。私がwordsim353(NLTK)やGoogleの他のオンラインデータセットのような他のデータセットを使用すると、ファイルの自分のドメインデータセットに固有のモデルを構築したため、動作しません。 word2vecの

    1

    1答えて

    私の目標は、word2vecを使用してキーワードのセットで最も関連性の高い単語を見つけることです。たとえば、単語が[girl, kite, beach]の場合、word2vecから関連語を出力したいとします。[flying, swimming, swimsuit...] 私はword2vecがサラウンド単語の文脈に基づいて単語をベクトル化することを理解しています。だから私は何をしたか、次の関数を使

    0

    1答えて

    私は以下のコードを実行していますが、gensim word2vecは語彙エラーでない言葉を投げています。あなたは私に解決策を教えてもらえますか? import logging logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) sentences = [["Th

    0

    1答えて

    "SIF Embeddings"を適用してGoogleニュースベクターを使用して、 "男の子はサッカーをしています"と "子供はサッカーをしています"のような2つの文章の類似性を得ることができます。 私のような技術的なもの2つの文の類似取得したいと思い、「抽象クラスは何を?」 "クラスとは何ですか?" 類似性を得るためにGoogleニュースのベクターを使用しましたが、うまく機能しませんでした。 ト