2011-06-21 8 views
0

外部ソースからデータをインポートしています。このデータにはグローバルキーがないため、一致するVarchars、Datesなどがあります。ユニークキーなしのデータ比較

質問は:どのようにVarchar比較の性能を良くするか?また、一致するパーセンテージを表示できるツールもあります(行の類似性のように:90%)

ありがとう!あなたがいる場合は、あなたの質問に直接答えではないけれども、あなたがデータをインポートしている場合、

WHERE SOUNDEX(some_column) = SOUNDEX(‘some_string’) 

答えて

2

その後、統合サービス(:「類似」発見のために

+0

SSISの使い方の簡単なステップをどこかで教えてください。これはすばらしく見える! – user194076

+0

単純なETLパッケージの作成:http://msdn.microsoft.com/en-us/library/ms169917.aspx - http://msdn.microsoft.com/en-us/library/ms167031.aspx –

+0

ファジィルックアップ変換:http://msdn.microsoft.com/en-us/library/ms137786.aspx –

1

あなたは比較のような音を使用することができます一致しますそれをまだ使用していない)はまともな選択ではありません。 SSISに含まれるいくつかの変換では、類似性の信頼度に基づいてデータを照合する「ファジーマッチング」が可能になります。

+0

うわー、この機能について聞いたことはありません。ありがとう! – user194076