2017-09-11 4 views
0

私は100サイズのサイズのdoc2vecモデルを作成しました。私が読んで理解していることから、これらの次元は私のモデルの特徴です。どのようにこれらの次元が正確であるかを特定することができます。doc2vecモデルの寸法を確認してください

答えて

0

Doc2Vecの背後にある 'Paragraph Vectors'アルゴリズムは、他の訓練されたドキュメントベクトルと比較して、距離/方向の配置が面白いドキュメントベクトルを単に与えるだけです。

個々の次元には、解釈可能な意味がありません。 Word2Vecと同様に、関連するアイテムの「近隣」が存在する可能性があり、特定のdirectionsが理解しやすい概念に曖昧にマッピングされる可能性があります。

しかし、それらの方向は、座標空間の個々の垂直方向の寸法に直接揃っていません。そして、その方向性の傾向を説明するのに役立つものは何もありません。

Document Embedding With Paragraph Vectors」という論文の例を見ることができます(表2を参照)。表2では、「おそらく」類似している日本のポップアーティストが、レディガガは、-'American'+'Japanese'の方向に空間を移動することによって発見されます。つまり、日本人対アメリカ人の次元はありませんが、すべての次元で方向性があります。

関連する問題