2017-08-01 5 views
0

単語埋め込みベクトルに対して実行できる代数関数の詳細を知りたい。コサインの類似性によって私は最もよく似た言葉を得ることができます。しかし、私は推論のもう一つのレベルを行い、以下の関係を得る必要があります:ワード埋め込み関係

X1とX2の関係は、X3とX4の関係に似ています。

たとえば、王子と王子の関係は、女性と男性の関係にあると言えます。私はX1からX3を持っています、そして、私の問題は、どのように効率的に私はX4ができるのか理解できることです。ベクトルの絶対差に余弦を試しましたが、うまくいきません。

答えて

0

あなたは、元Googleのリリースword2vecコードがそのword-analogy.cコードにアナロジーを解決し、正確にどのように見ることができます:

https://github.com/tmikolov/word2vec/blob/master/word-analogy.c

あなたは、Pythonをより精通している場合、あなたはどのようにgensim Word2Vecの実装を見ることができますquestions-words.txtファイル(元のGoogle word2vecパッケージで提供されている)から類推 "a:b :: c:expected"を読み込み、bcを肯定的(追加)の例として使用して、類義語をそのaccuracy()メソッドでテストし、 aを負の例(減算)、th ENが得られたベクターの近くの単語を見つける:

https://github.com/RaRe-Technologies/gensim/blob/5f630816f8cde46c8408244fb9d3bdf7359ae4c2/gensim/models/keyedvectors.py#L290

https://github.com/RaRe-Technologies/gensim/blob/5f630816f8cde46c8408244fb9d3bdf7359ae4c2/gensim/models/keyedvectors.py#L697

最も近いベクトルのリストを返す前に複数positivenegative例を受け付ける使用most_similar()機能、動作、で見られます

関連する問題