word2vecで2つの単語フレーズの類似度スコアを見つけるにはどうすればよいですか？ word2vecで

、類似性スコアを見つけるためには、/単一ワードの最類似した単語は、今私のような単語のフレーズの類似性スコアを、見つけたい、しかしword2vecで2つの単語フレーズの類似度スコアを見つけるにはどうすればよいですか？ word2vecで

model.most_similar('man') 
model.similarity('man', 'woman')

によって行うことができる

model.most_similar('battery life') 
model.similarity('battery life', 'battery') 
model.similarity('battery life', 'sound quality')

私はKeyErrorを取得しました：語彙ではない「単語」電池寿命」、これはword2vecで可能ですか？

2017-02-13 Lee Kevin

現在のword2vecモデルにはどの単語が含まれているかによって異なります。ライブラリがある場合は、model.most_similar("battery_life")を使用してアクセスできます。ライブラリはアンダースコアを使用してnグラムの単語を区切るためです。

2017-02-13 07:37:19 Derongan

バッテリーの寿命はすでにmodel.most_similar（ "battery_life"）を使用して私の訓練コーパスに残っていますが、私にはまだKeyErrorが返っています。 –

word2vecは、フレーズではなく単語に埋め込みを行うことを理解する必要があります。フレーズの埋め込みを生成するための最先端技術にはいくつかのアプローチがあります。そのうちのいくつかは、次のとおりです。

これらのフレーズ埋め込みを生成するための良いアプローチです。

しかし、単純に単語埋め込みからフレーズ埋め込みを取得したい場合は、おそらくconcatenate/add/averageという語句を語句に埋め込むことができます。例えば

：

ここ

phrase_embedding['battery life'] = word_embedding['battery'] + word_embedding['life']

、'+'は、2つのワードベクトルの連結を表します。

2017-02-14 19:14:12

答えて