2016-06-11 7 views
1

私はpySpark MLlibと協調フィルタリングのボックスからALSのメソッドを使用しています。ちょうど不思議なことに、スパークは、(距離を計算するための)フィルタリングを行ういくつかの他の方法を提供していますか?例えば、PearsonやCosine?彼らはスパーク環境で行うことができますか?Spark MLlibリコメンダーエンジンのメソッド

多くの感謝!

答えて

1

ありSparkにはCosineの類似性の実装があります。 Scalaでは

https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/mllib/CosineSimilarity.scala 

// Load and parse the data file. 
    val rows = sc.textFile(params.inputFile).map { line => 
     val values = line.split(' ').map(_.toDouble) 
     Vectors.dense(values) 
    }.cache() 
    val mat = new RowMatrix(rows) 
    val exact = mat.columnSimilarities() 
関連する問題