ムービー、音楽、ブックのおすすめにコラボレーションフィルタリング(CF)がどのように使用されているかはわかっています。論文「Collaborative Topic Modeling for Recommending Scientific Articles」では、著者は〜5,500人のユーザーと〜17,000の科学論文に適用された共同フィルタリングの例を示しています。約200,000のユーザ - アイテムの対によって、ユーザ - 記事マトリクスは明らかに非常に疎です。ニュース記事またはブログ投稿のコラボレーティブなフィルタリング
matrix factorizationとの共同フィルタリングをTwitterで共有されているすべてのニュース記事について行うとどうなりますか?この行列は、CFをあまり適用できないようにする(科学論文の場合よりも)より疎であろう。もちろん、記事のテキストを考慮して、コンテンツ認識分析を行うこともできますが、それは私の焦点ではありません。あるいは、ユーザー記事マトリックスをより密にするために、時間窓を制限することができます(たとえば、最終日または週に共有されるすべてのニュース記事に焦点を当てる)。他のアイデアは、行列が非常に疎であるという事実とどのように戦うか? CFの分野におけるニュース記事の推奨事項の調査結果はどうなっていますか?ありがとうございます!
疎行列の問題は何ですか?行列がメモリに収まらない、または結果が不正確であることを意味しますか? – ffriend