1
trainImplicitを使用して購入履歴に基づいて推薦システムを作成しようとしています。私の入力は、ドメイン[1、+ inf](ビューと購入の合計)にあります。Spark MLlibの理解ALS.trainImplicit入力形式
入力したRDDの要素は、[(user_id,item_id),rating] --> [(123,5564),6]
のようになります。ユーザ(id = 123)はアイテム(id = 5564)と6回インタラクトしました。
[(user_id,item_id),rating] --> [(123,2222),0]
などのRDD要素を追加する必要があります。これは、特定のユーザーが指定したアイテムとやりとりしたことがないことを意味します。つまり、ALS.implicitTrainはこれを暗黙的に行いますか?
ゼロを含むデータセットで訓練されたモデルは、ゼロのないデータセットで訓練されたモデルとほぼ同じ推奨を与えるでしょうか?または、これらの追加のゼロが結果に影響しますか? – Masha
暗黙のうちに結果に影響を与えるべきではありません。明示的に結果に大きな影響を与えます。 – user7337271