2009-04-24 3 views
4

私は、ユーザーが購入するいくつかの製品のデータを入力するサイトを持っています。クラウドソーシングによって収集されたデータの正確性を保証するにはどうすればよいですか?

クラウドソーシング(ユーザーが商品を投票/編集できるようにする)によって入力されたデータの正確性を保証するにはどうすればよいですか?いくつかのハウツー、ベストプラクティスなどを探しています。

+0

「クラウドソーシング」です。タイプミスを修正すると、検索エンジンで質問が見つけやすくなります。 :) – Tomalak

+0

固定スペル.... –

+0

@Yuval A:ああ、よく。スペルの間違ったタグを見るのを忘れた。 – Tomalak

答えて

0

関連度の高い値で「群衆」から高レベルのデータを収集することができます。あなたが1000人以上の担当者からの回答または回答であるSOを見ると、カジュアルなユーザーよりも多くの人がいます。妥当性確認と三角測量を探してください。群衆の中であなたが聞いている単一の声であれば、それほど価値はないでしょう。他の声が参加すれば、あなたは何かに就いていることを知っています。再び、私たちは皆、質問をアップアップする機会を得ます。

私は最近、自分のデータを群集に頼っている本当に良いiPhoneアプリを見た後、他のユーザーに正しいかどうかを尋ねて検証します。

1

悪意のあるユーザーやボットがセッションデータやCookieを盗んだりするたびに、IPアドレスのログを保持してください。これにより、単一のエンティティが複数のユーザーであると見せかけて結果を歪ませたり、劇的なことをすることができなくなります。

2

あなたはどのようなデータを収集していますか?

あなたは群衆調達について話しているので、この群衆全体のデータを集約していると思います。彼らが購入する製品について話しているとき、私はあなたが製品の属性と価格を引き継ぐと思っています。

いくつかの考えられる方法。ユーザーが非数値データ(色など)を入力している場合は、最も一般的なエントリまたはモード(最も一般的に入力されたもの)を記録してください。

数値データを入力する場合、アウトライヤーを破棄します。 (これは、電子取引所が多くの取引の中で終値を決めるために使用するアプローチです)。

アプリケーションによっては、最新のエントリに向かって過去の偏見がある場合があります。

しかし、これはすべてあなたのアプリケーションと、あなたが行う準備ができているデータの量とストレージの量によって異なります。

+0

実際に食用製品の成分のリストを収集していますが、入力された各成分を特定しています 製品中にいくつかの成分が現れたり消えたりする状況があります 本当に必要なものは、最も一般的なエンティティだけでなく... – miceuz

関連する問題