word2vec

0熱

1答えて

word2vecの使用中に、現在の単語がUSまたはmondayの場合、その単語を確認するにはtheは、USの前に来る可能性が高いです。 nextは、単語mondayの前に共通のオカレンスがありますか？

0熱

1答えて

私は約30のword2vecモデルを持っています。 Pythonスクリプトでそれらを読み込むと、それぞれ数GBのRAMが消費されるため、一度にすべてを使用することはできません。完全なモデルをRAMにロードせずにモデルを使用する方法はありますか？

0熱

1答えて

gensim doc2vecでは、ほとんどすべてのコサインの類似性が単語または文書ベクトル間で正であるのですか？

私はgensimでDoc2Vec.docvecs.similarity（）を使用してドキュメントの類似性を計算しました。ここで、gensimがコサインの絶対値を類似メトリックとして使用した場合、コサインの類似性は[0.0、1.0]の範囲にあると予想します。 30000のドキュメントの私のセットでペアごとの類似点の1％未満 - しかし、私が見ていますと、一部類似点は否定しているが、彼らは非常に稀であ

0熱

1答えて

spark word2vecの例の説明と文字列の類似性を取得する方法

sparkのドキュメントページの例に従って、word2vec、linkを使用しました。それは機能しましたが、私はそれが何を計算しようとしているのかよく分かりませんでした。出力ベクトルは出力文字列表現ですか？「はい」の場合は、それらの間のコサインの類似度を計算しようとしましたが、ベクトルが正ではないため、負の値があります。 word2vecをスパークさせると、陽性のみのベクターができますか？ S

0熱

1答えて

tensorflowからgensimへの単語ベクトルのインポート

tensorflowから作成した単語vectersをインポートしてgensimで利用したいと思います。方法gensim.models.KeyedVectors.load_word2vec_format は私はTraining wordvec in Tensorflow, importing to Gensim 実施例と全く同じ方法に従うことによって、この方法を試みがある： WORD0 -0.00

1熱

1答えて

ペアワイズEarth Moverすべてのドキュメント間の距離（word2vecの表現）

ドキュメントのリストを取得するライブラリがあり、距離のnxn行列を計算する - word2vecモデルが提供される場所は？ジェネリックでは2つのドキュメントの間でこれを行うことができますが、すべてのドキュメント間で高速比較が必要です。 sklearnsのようなcosine_similarity。

2熱

1答えて

word2vecに基づいて同義語を見つける方法

私は、gensimを使ってword2vecモデルをPythonで使っていますが、結果は同じテーマを持つ単語であり、同義語は結果の一部にすぎません。私が行った作業に基づいて単語の同義語を見つけることはできますか？返信いただければ幸いです！

2熱

1答えて

pythonでgensimモデルを使用しているときにエラーが発生しました

私は、gensimモデルを使用してデータを処理している間に、そのデータを訓練してdoc2vecファイルを作成しました。私はエラーが発生しています。は、私は以下のコードを実行しています： - モデル= Doc2Vec.load（ 'sentiment140.d2v'） if len(sys.argv) < 4: print ("Please input train_pos_count,

1熱

1答えて

PythonモジュールをHerokuにデプロイしますか？

私は、HerokuにPythonモジュールを配備する際に問題があります。これはpython2に基づいています。 requirements.txtファイル：私はトラブルのアップロードを抱えている Flask==0.11.1 Jinja2==2.8 MarkupSafe==0.23 Werkzeug==0.11.10 click==6.6 gunicorn==19.6.0 itsdang

1熱

2答えて

非常に小さなおもちゃのデータセットに対して、反復回数の多いWord2Vecは機能しますか？

私は手で作った非常に小さなおもちゃのデータセットでまずWord2Vecを動かそうとしています。私は私の主なデータセットに行く前にそれを正しく行っています。しかし、99000回の反復を行ったにもかかわらず、結果はあまり良くありませんでした。（タイガーとライオンは私が思ったほど高い類似性を持たなかった）。玩具セットは：理論的に s= [['Tiger', 'Zebra'], ['Tiger', '