2011-07-22 11 views
0

データベース内の参照フィールドをプロファイルして、構成パターンを理解する必要があります。これは、参照フィールドにスペースや句読点がないため、文字レベルで行う必要があります。SSISまたはSQL Serverの文字レベルプロファイリング

ABA1235DV6778 ABA1235DV6788 ABA2335DV6778

などのパターンを提案:

ABA \ D \ d35DV67 \ D \

は、一例として、私のような入力を取得するソリューションを探していますd

これは、これらの列の許容値を理解できるようになると、これらの参照フィールドを後で検証するために使用されます。

SSISでプロファイリング機能を調べましたが、粒度が不足しているようです。 SSIS 2008でプロファイリングをどのように調整するか、これを達成するために使用できるSQL Server 2008の効率的な機能をどのように調整できるかは誰にも分かりますか?

任意の助けをいただければ幸いです、

ニール

答えて

1

は、それはあなたが文字列に適用したいロジックを正確にあなたのポストから本当に明確ではありません。私はedit distanceという形式を使って同様の文字列を特定し、それにすべて一致するgenerate a regular expressionを使用したいと思っています。これらは通常、SSISまたはSQL Serverではなく、適切な言語で記述された外部プログラムで実装されるタスクです。これは、既存のSSIS機能では不可能なことです。

私は今はSSISを忘れてしまい、.NETでアルゴリズムを実装する最良の方法を考え出します。

  • は、自己完結型の実行可能ファイルを作成し、実行プロセス・タスク
  • からそれを呼び出す.NETのDLLを書き、スクリプトタスク、スクリプトコンポーネントでそれを使用する:あなたがするかどうかを決定できることをやったらまたはCLRストアドプロシージャ
  • は、独自のカスタムSSISコンポーネント
  • ではなく、SSIS
+0

を使用しての完全なプログラムを書くはい、私はCLR機能を使用する必要がありますことを想像してみてください。基本的に私はパターンを包み込むパターンではなく、パターンの候補を探しています。 SSISプロファイラはこれをある程度まで実行しますが、候補をかなり早く削除するようですので、人口の大部分がまったく同じパターンを持たない限り、結果には\ w +のようなものしか見えません。 – niallsco

関連する問題