2009-06-19 9 views
16

ちょうどrecent article in Wiredを読んでいて、私は興味があります:Netflix賞について、それは何が挑戦的なのでしょうか?私は可能な限り誠実なやり方でこれを意味します、私はコンテストによってもたらされた困難に興味があります。ほとんどの推奨エンジンは一般的に改善が難しいですか?もしそうなら、それはなぜですか?または、Netflixの改善が非常に難しく、このような場合は、Netflixにとって特別な点は、これをAmazonよりもはるかに難しくしていますか?Netflix賞はなぜ挑戦的なのですか?

+0

これはなぜですか?閉じる。 –

+13

@Lucasこれはプログラミング上の課題とその技術的な詳細に関する質問ですので、プログラミングに関連しています。私はなぜこの*がそうでないのか分かりません。 –

+2

どうしてですか?推薦エンジンはもちろんプログラミング関連です。 SO上の最良の質問ではないかもしれませんが、それでも。 – dmeister

答えて

13

NetFlixにはすでに推奨エンジンがあります。彼らがそれを簡単に改善する方法を知っていたら、今までにそうしていたでしょう。彼らのビジネスモデル全体は、製品(映画)を消費者にクロスセリングすることです。リコメンデーションアルゴリズムは実際にはビジネスの核心です。それがうまくいくほど、彼らはより多くのお金を儲けます。

+1

...巨額の安い在庫、ロングテール、(信頼性の高い)定期購読収入、そしてネットの消費者が数多くの顧客に届くことは、ビジネスモデルにとっても非常に重要です。 – isomorphismes

2

私はこれに書かれたいくつかの記事があると思いますが、私は彼らが現時点でどこにいるかわからないので、ここで説明します。

アマゾンで書籍を購入すると、特定の種類の書籍を購入する傾向があるため、同じ種類の他の書籍を簡単に提案することができます。

映画では、人々は同じことをすることがありますが、通常は1つのジャンルに限定されません。

あなたがそれらのジャンルから好きなものを予測することは、これまでに1つの映画をレンタルしたことがあるかどうかを予測するのは難しいかもしれません。その映画ドラマです。

誰かが非常に巧妙な推薦エンジンを思いつくなら、Netflixは驚くほど恩恵を受ける可能性があります。私は彼らが主に1つまたは2つの映画だけに基づいて物事を推薦できるエンジンを探していると思います。 Netflixについてあまり知らない新しい顧客は、検索しなくても早い段階で好きな映画を見つけることができれば、まわりをくぐり抜ける可能性が高くなります。

私の意見では、彼らはすでにAmazonと同等の推奨エンジンを持っています。私は彼らがそれをさらに強化することを望んでいると思う。

1

私と私の同僚が参加しました。私は強力なAIの背景を持っていませんが、推薦エンジンは、ギブスサンプリング、K法、最近隣などの既存の文献アルゴリズムの深い知識を必要とします。私たちはギブスサンプリングを使用しました。

29

推薦システムを修正するのは難しいですな問題に苦しむ:

  • Cold start - 新しいシステムでは、または新規ユーザーと、勧告のための正確な統計モデルを作成するための十分なデータがありません。
  • Rating bias - ユーザーの評価に関する推奨事項に基づいている場合、評価の高いユーザーはしばしば結果を自分の好みに向かわせます。あなたが格付けの余分なステップが気に入らないタイプの人であれば、類似した味の人が評価を好まない可能性があるので、彼らの意見は推奨から除外されます。
  • 評価されていないアイテムは、評価される可能性が低くなります。レーティングに基づいてアイテムを選択して評価すると、評価されていないアイテムは目立たず、必要な評価を得るのが難しくなります。推奨事項に影響を与えます。他の方向では、人気のあるアイテムはより多くの視認性を持ち、より頻繁に評価され、したがって、推奨の中でより大きな役割を果たす。
  • Temporal bias - ユーザーの評価は時間とともに変化します。長期的な変更により、推奨事項に時間要素を追加することで補うことができます。短期的な変更は修正するのが難しいです。Chuck Norrisマラソンの後、あなたはアクション映画に高い評価を与える可能性があります。翌日、あなたの目をSteel Magnoliasに泣いた後、一時的にアクション映画に偏っているかもしれません。
  • 動機を変える - (あなたがそれを使用しないようにシステムに指示するための時間がかかるしない場合)item-based recommender systemsに、あなたはあなたの叔母の誕生日のために購入した編み物の本は、あなたの提言をスキューします。あなたの子供はそれを愛していたので、悪い子供たちの映画に高い評価を与えるかもしれません。

このようにすると、これで、推奨システムを改善するのが難しくなります。 80%の精度を持つシステムは素晴らしいようですが、5回のうち1回は間違っています。これにより、一部のユーザーにとって価値のあるものよりも多くのトラブルが発生します。

+1

スタックオーバーフローを伴う推奨エンジンタグ全体の中で最良の答えの1つです。 :) – isomorphismes

関連する問題