2
私は現在、データベースの一部に誤ラベルが付いています。データベースの異常値データポイントを検出する方法
例データ:このデータに
Product - Price - SalesDate
ProdA - 10 - 1/1/2016
ProdB - 20 - 1/2/2016
ProdA - 100 - 1/3/2016
ProdB - 20 - 1/4/2016
ProdB - 21 - 1/5/2016
ProdA - 11 - 1/6/2016
レコードセット "ProdA - 100 - 2016年1月3日は、" エラーが発生したものです。おそらく価格を入力した人は入力ミスを犯したはずです。さらに、異なる日にProdAが価格を変える可能性があるため、この問題が面白くなります。
この種類のレコードを特定するのに役立つツールにはどのようなものがありますか?異常値データポイントをSQLで手助けすることはできますか?私はこれについて機械学習を調べ始めるべきですか?
あなたの質問には使用しているデータベースを付けてください。 –