2011-12-16 2 views
6

私は、すべてのドキュメントが同じフォントとフォントサイズを使用するドキュメントをスキャンするシステムを持っているとします。"W"のように、ハフ変換で正確に定義済みの形を検出するにはどうすればよいですか?

これらの文書では、常に同じ見た目の文字「W」があります。それは常に20 px大きいとしましょう。どのようにして私の文書の中で20 pxというこの文字「W」を認識するようにハフ変換を設定できますか?

答えて

3

迅速なGoogle検索は、関心のある次のような情報が得られます

Generalizing the Hough Transform to Detect Arbitrary Shapes

をし、それがそのソースとして上記の紙を使用してlectureのように見えます。

また、実際の「W」の場合、TesseractのようなOCRエンジンはニーズに適していますか?

+0

Tesseractは完璧ではありませんが、文字認識のための改良されたソリューションよりも優れています。 – Sam

+0

True!しかしシナリオはかなり自由です。私が何を得ようとしていたかは、それがまっすぐな線であるという事実です。私はハフ変換が簡単な直線である形状をかなり簡単に扱えるようにする必要があると感じています。そうじゃないの?投票して、tesseractへのクールなリンク。 –

1

ラインのハフ変換は、最適なライン方程式を見つけます。線分だけを見つけるには、追加の処理を行う必要があります。文字の太さが数ピクセルの場合、線を効果的に見つけるには、太さを1ピクセルに減らしたい場合があります。これを行う手法はありますが、さまざまなアルゴリズムトラップもあります。

線分があれば、線分の相対的な位置と角度に基づいて文字を識別するアルゴリズムを記述する必要があります。最初のものよりも難しいです。

正規の相互相関(テンプレートマッチング)は、イメージが常に一定の回転になることが確かな場合には機能しますが、文字は常に同じサイズになります。スキャンしても表示されますいくつかの回転とコントラストのいくつかの変化。

商用OCRパッケージまたは合理的に良いオープンソースプロジェクトを使用するのは長期的には安いでしょう。イメージ処理に精通していない場合は、OCRを実装するのは難しいです。

関連する問題