4

ユーザーAとユーザーBが製品Cを好きであれば、彼らは互いに「アルゴリズムに従うことに興味があるかもしれません。実行時に類似点を計算することは、応答が遅くなるため、十分にスマートだとは思わない。一方、一晩の索引を計算するには、(N * N-1)回の異なるランを作成する必要があります。ここでNはユーザーの数です...それほど巧妙でもありません。さらに、ユーザーが新しい製品を好きになるたびに、または新しいユーザーが登録するたびに、インデックスを再計算する必要があります。推奨エンジンについて

ここで適用できる最もスマートなものは何ですか?いくつかの種類の超高速ハッシングは、新しい項目だけが追加されます。

答えて

0

私がUniのコースで勉強したアルゴリズムの中には、このようなものを扱うものがありました。彼らの推奨されるアプローチは、ユーザーの各ペア(「あなたのN * N方法が言及していると思います)」の「類似性」インデックスを計算し、それに基づいて特定のユーザーが最も近いユーザーを決定することでした。

もちろん、すべての変更の類似度インデックスを直ちに再計算する必要はありません。しばらくの間は、検索エンジンクローラのように動作します。実際に、初期インデックスを計算すると、さまざまな発見的方法を使用して、自分の好みを速く変更するユーザーの方が頻繁に再計算され、まれにしか変更しないユーザーの方がはるかに遅くなります。

0

あなたはRDFデータベースについて考えましたか? Like OWLIM