2017-02-13 7 views
0

、類似性スコアを見つけるためには、/単一ワードの最類似した単語は、今私のような単語のフレーズの類似性スコアを、見つけたい、しかしword2vecで2つの単語フレーズの類似度スコアを見つけるにはどうすればよいですか? word2vecで

model.most_similar('man') 
model.similarity('man', 'woman') 

によって行うことができる

model.most_similar('battery life') 
model.similarity('battery life', 'battery') 
model.similarity('battery life', 'sound quality') 

私はKeyErrorを取得しました:語彙ではない「単語」電池寿命」、 これはword2vecで可能ですか?

答えて

0

現在のword2vecモデルにはどの単語が含まれているかによって異なります。ライブラリがある場合は、model.most_similar("battery_life")を使用してアクセスできます。ライブラリはアンダースコアを使用してnグラムの単語を区切るためです。

+1

バッテリーの寿命はすでにmodel.most_similar( "battery_life")を使用して私の訓練コーパスに残っていますが、私にはまだKeyErrorが返っています。 –

0

word2vecは、フレーズではなく単語に埋め込みを行うことを理解する必要があります。フレーズの埋め込みを生成するための最先端技術にはいくつかのアプローチがあります。そのうちのいくつかは、次のとおりです。

これらのフレーズ埋め込みを生成するための良いアプローチです。

しかし、単純に単語埋め込みからフレーズ埋め込みを取得したい場合は、おそらくconcatenate/add/averageという語句を語句に埋め込むことができます。例えば

ここ
phrase_embedding['battery life'] = word_embedding['battery'] + word_embedding['life'] 

'+'は、2つのワードベクトルの連結を表します。

関連する問題