2011-07-30 12 views
3

2つまたは3つのフォントしか使用されていない文書の白黒画像があるとします。 3つのうちの1つはタイトルのために使用され、もう1つは小さなフォント(または少なくとも非常に明白)です。例えば、テキストの小さなビットの1つは次のようになります。OCRと2つまたは3つのフォントの区別

Fancy/Bolded/Italicized/Script font: The Best Soup In The World 
Plain/small: Made with tap water, salt, and sugar. 

Fancy/Bolded/Italicized/Script font: The Best Soup and 1/2 Sandwich In The World 
Plain/small: Made with flour, tap water, salt, and sugar. 

私は「Bestスープ」はイタリックの/ etcと特定のファンシーフォントを使用することを私に伝えることができ、大きな派手なOCRシステムを必要としません。私は「ベストスープ」が「水道水」とは多少異なってフォーマットされていること、「ベストスープ」と「サンドイッチ」はおそらく同じフォーマットを使用しており、「サンドイッチ」は「タップ」よりも大きい/水。"

実際のOCRとバウンディングボックスの検出(http://www.mail-archive.com/[email protected]/msg02157.html)を行うにはTesseractを使用します(該当する場合)。

この単純な書式の分類を行うために使用できるものはありますか?

編集:

は私の腕と脚の原価計算せずにこれを行いますそこにはありますか?

答えて

1

私はtesseractがあなたが記述するタスクを解決できるかどうか分かりませんが、良いocrエンジンはフォントスタイルを検出するはずです。たとえば、ABBYY OCR SDKは、太字/斜体のフォントスタイルを識別するだけでなく、出力に使用する適切なフォントフェイスを定義することもできます。

あなたの記述に基づいて、ヘッダーレベルなどの文書スタイル階層を決定しようとしていると思います。ABBYY FineReader Engineはこの機能を提供し、フォントサイズ&のスタイルベースのテキスト用途ルーチンに従事していません。さらに、それは最高のocrの品質を提供し、試してみるのは無料です。商用ソフトウェアを計画する場合は、試してみてください。私は@ ABBYYを働き、必要に応じてOCR SDKの詳細を提供することができます。

よろしくお願いいたします。

+0

静かにあなたの会社を押している間に役立つ応答を提供してくれてありがとう。 :) 私は、私が請求するかどうかを決定していないので、私は他の可能性を引き続き検討します。 –

関連する問題