word2vec

    0

    1答えて

    word2vecの使用中に、現在の単語がUSまたはmondayの場合、その単語を確認するにはtheは、USの前に来る可能性が高いです。 nextは、単語mondayの前に共通のオカレンスがありますか?

    0

    1答えて

    私は約30のword2vecモデルを持っています。 Pythonスクリプトでそれらを読み込むと、それぞれ数GBのRAMが消費されるため、一度にすべてを使用することはできません。完全なモデルをRAMにロードせずにモデルを使用する方法はありますか?

    0

    1答えて

    私はgensimでDoc2Vec.docvecs.similarity()を使用してドキュメントの類似性を計算しました。ここで、gensimがコサインの絶対値を類似メトリックとして使用した場合、コサインの類似性は[0.0、1.0]の範囲にあると予想します。 30000のドキュメントの私のセットでペアごとの類似点の1%未満 - しかし、私が見ていますと、一部類似点は否定しているが、彼らは非常に稀であ

    0

    1答えて

    sparkのドキュメントページの例に従って、word2vec、linkを使用しました。それは機能しましたが、私はそれが何を計算しようとしているのかよく分かりませんでした。 出力ベクトルは出力文字列表現ですか? 「はい」の場合は、それらの間のコサインの類似度を計算しようとしましたが、ベクトルが正ではないため、負の値があります。 word2vecをスパークさせると、陽性のみのベクターができますか? S

    0

    1答えて

    tensorflowから作成した単語vectersをインポートしてgensimで利用したいと思います。 方法gensim.models.KeyedVectors.load_word2vec_format は私はTraining wordvec in Tensorflow, importing to Gensim 実施例と全く同じ方法に従うことによって、この方法を試みがある: WORD0 -0.00

    1

    1答えて

    ドキュメントのリストを取得するライブラリがあり、距離のnxn行列を計算する - word2vecモデルが提供される場所は?ジェネリックでは2つのドキュメントの間でこれを行うことができますが、すべてのドキュメント間で高速比較が必要です。 sklearnsのようなcosine_similarity。

    2

    1答えて

    私は、gensimを使ってword2vecモデルをPythonで使っていますが、結果は同じテーマを持つ単語であり、同義語は結果の一部にすぎません。 私が行った作業に基づいて単語の同義語を見つけることはできますか? 返信いただければ幸いです!

    2

    1答えて

    私は、gensimモデルを使用してデータを処理している間に、そのデータを訓練してdoc2vecファイルを作成しました。私はエラーが発生しています。 は、私は以下のコードを実行しています: - モデル= Doc2Vec.load( 'sentiment140.d2v') if len(sys.argv) < 4: print ("Please input train_pos_count,

    1

    1答えて

    私は、HerokuにPythonモジュールを配備する際に問題があります。 これはpython2に基づいています。 requirements.txtファイル:私はトラブルのアップロードを抱えている Flask==0.11.1 Jinja2==2.8 MarkupSafe==0.23 Werkzeug==0.11.10 click==6.6 gunicorn==19.6.0 itsdang

    1

    2答えて

    私は手で作った非常に小さなおもちゃのデータセットでまずWord2Vecを動かそうとしています。私は私の主なデータセットに行く前にそれを正しく行っています。しかし、99000回の反復を行ったにもかかわらず、結果はあまり良くありませんでした。 (タイガーとライオンは私が思ったほど高い類似性を持たなかった)。 玩具セットは:理論的に s= [['Tiger', 'Zebra'], ['Tiger', '