データベース内の参照フィールドをプロファイルして、構成パターンを理解する必要があります。これは、参照フィールドにスペースや句読点がないため、文字レベルで行う必要があります。SSISまたはSQL Serverの文字レベルプロファイリング
ABA1235DV6778 ABA1235DV6788 ABA2335DV6778
などのパターンを提案:
ABA \ D \ d35DV67 \ D \
は、一例として、私のような入力を取得するソリューションを探していますdこれは、これらの列の許容値を理解できるようになると、これらの参照フィールドを後で検証するために使用されます。
SSISでプロファイリング機能を調べましたが、粒度が不足しているようです。 SSIS 2008でプロファイリングをどのように調整するか、これを達成するために使用できるSQL Server 2008の効率的な機能をどのように調整できるかは誰にも分かりますか?
任意の助けをいただければ幸いです、
ニール
を使用しての完全なプログラムを書くはい、私はCLR機能を使用する必要がありますことを想像してみてください。基本的に私はパターンを包み込むパターンではなく、パターンの候補を探しています。 SSISプロファイラはこれをある程度まで実行しますが、候補をかなり早く削除するようですので、人口の大部分がまったく同じパターンを持たない限り、結果には\ w +のようなものしか見えません。 – niallsco