2017-09-26 5 views
1

私の理解では、word2vecは、2つのモードで実行することができるということである。MLlibのword2vecをCBOWモードで実行するには?

  • 連続袋のワード(CBOW)(単語の順番は関係ありません)
  • 連続スキップグラム(言葉の順序が重要)

私は、SparkのMLlibからCBOW実装を実行したいと思いますが、それはそれを行う方法を文書化し、その例から、私には明らかではありません。これはそのページに掲載されている例です。

から:https://spark.apache.org/docs/2.1.0/mllib-feature-extraction.html#example

import org.apache.spark.mllib.feature.{Word2Vec, Word2VecModel} 

val input = sc.textFile("data/mllib/sample_lda_data.txt").map(line => line.split(" ").toSeq) 

val word2vec = new Word2Vec() 

val model = word2vec.fit(input) 

val synonyms = model.findSynonyms("1", 5) 

for((synonym, cosineSimilarity) <- synonyms) { 
    println(s"$synonym $cosineSimilarity") 
} 

私の質問:この例では使用しない2つのモードの

  • CBOWモードでモデルを実行する方法を知っていますか?

ありがとうございます!

答えて

関連する問題