私は、ユーザーが無料で広告を掲載できるように分類されたウェブサイト(PHPとMySQL)を用意しています。しかし、ユーザーは重複広告を投稿することがよくあります。スクリプトは正確な重複コンテンツを投稿することを許可していないので、1つまたは2つの文字を変更することでこれを行います。重複するコンテンツを削除するには?
重複した広告を見つけて(テキストの一部を変更したとしても)ユーザーに警告する方法はありますか?
私のサイトはPHPとMySQLにあります。私は検索のためにsphixを使用しています。これをmongodbとapache solrに変更しようと考えています。
内容が重複していますか?何文字ですか? 1週間に1回しか広告を掲載できないという制限があります。 –
ユーザーが偽のパラメータを追加していますか?つまり、http://foo.com/image.png?fakeparam=1?この場合、すべてのパラメータを削除し、パラメータなしのURLのみを考慮することができます。しかし、これは人々が別の名前で同じファイルを再アップロードするのを止めることはありません... –
@ Alexander Cogneauコンテンツが80%類似していると私は広告を重複していると見なします(例えば、そこなど)。 いいえ、私たちは同じ日に複数の広告を投稿する人を制限することはできません。同じ日に投稿された重複コンテンツを手動で見つけることはできますが、1週間前の投稿を検索することはできません –