2016-06-30 2 views
2

ディープラーニングwith Pythonを学びたい。 便利なシナリオのために私が最初に気がついたのは重複チェックでした。Pythonディープラーニングが重複して見つかる

名前、住所、電話番号、メールアドレスの顧客表があり、新規顧客を挿入したいとします。 例えば:これは、重複したエントリとして認識されるべき

In Table: 
Max Test,Teststreet 5, 00642/58458,[email protected] 
To Insert: 
Max Test, NULL, (+49)0064258458, [email protected] 

このユースケースのチュートリアルは既にありますか?それとも、深い学習でも可能ですか?

答えて

1

重複マッチングは、類似性マッチングの特殊なケースです。入力機能を個々の文字またはフィールドとして定義し、ネットワークをトレーニングすることができます。これは、類似性スコア(95%一致)を望む場合を除き、バイナリ分類の問題(真偽)です。ネットワークは、句読点と空白が無関係であり、真の陽性を生成するために一致するフィールドの少なくとも1つについて「または関数」であることを知ることができなければならない。

深い学習のためのかなり単純なケースのように聞こえます。

具体的なチュートリアルはありませんが、探したいキーワードをいくつか教えてください。

関連する問題