Spark MLlibの理解ALS.trainImplicit入力形式

trainImplicitを使用して購入履歴に基づいて推薦システムを作成しようとしています。私の入力は、ドメイン[1、+ inf]（ビューと購入の合計）にあります。Spark MLlibの理解ALS.trainImplicit入力形式

入力したRDDの要素は、[(user_id,item_id),rating] --> [(123,5564),6]のようになります。ユーザ（id = 123）はアイテム（id = 5564）と6回インタラクトしました。

[(user_id,item_id),rating] --> [(123,2222),0]などのRDD要素を追加する必要があります。これは、特定のユーザーが指定したアイテムとやりとりしたことがないことを意味します。つまり、ALS.implicitTrainはこれを暗黙的に行いますか？

2016-12-28 Masha

これは必須ではありません。暗黙的に行う必要はありません。明示的に行うべきではありません。

2016-12-28 16:48:33 user7337271

ゼロを含むデータセットで訓練されたモデルは、ゼロのないデータセットで訓練されたモデルとほぼ同じ推奨を与えるでしょうか？または、これらの追加のゼロが結果に影響しますか？ – Masha

暗黙のうちに結果に影響を与えるべきではありません。明示的に結果に大きな影響を与えます。 – user7337271

答えて