2017-08-29 12 views
0

Gensimは、リストから外れ値の単語を返す "doesnt_match"という関数を実装しています。Gensim doesnt_match関数はどのように機能していますか?

この関数は、ワードベクトルオブジェクトで呼び出されます。

model.wv.doesnt_match( "朝食シリアルの夕食弁当" .split()) '穀物'

ドキュメントはこの機能が実際に(計算の背景が何であるかを)どのように動作するかを指定されていない

誰でも知っていますか?

答えて

0

doesnt_match() method's source codeをご覧ください。詳細は11行のみです。 です。

しかし、それの要旨は...

  • は、すべての単語ベクトルの平均を取る - すべての候補者のための「中央」の一種
  • は、その中心部からのコサイン距離を計算します各単語 - これは各関連ベクトルの単位正規化されたバージョン間のドット積です
  • その平均から余弦距離が最も長い単語を返します
関連する問題