2010-11-20 6 views
1

特定の フォントセットを下の画像 から生成することはできますか?テキストのイメージからフォントを生成

私の考えは、テキストの下に与えられた画像のための特定のフォント を生成 によって手動で画像の部分を選択し、 letter's.Generateのセットにこの のフォントを、それをマッピングし、その後、これを使用することですOCRのために を読むことができます。 の実装を使用して フォントの生成が可能ですか?また、良いOCRを として提案してください。

alt text

+0

@downvoter:説明してください。 – Emil

+0

私はyとg上のそれらの子孫は、ほとんどのOCRプログラムを混乱させると思います。 –

+0

@jcomeau_ictx:良いOCRを使いましたか? – Emil

答えて

1

ABBYY FineReaderの10が期待される結果よりも良くなりますが、予想通りの文字が触れたときに混乱してしまいます。

問題は、行間隔が小さすぎることです。各行のディセンダは、すぐ下にある行の文字の文字の境界ボックスと重なります。これは、文字が接触して重なっているため、文字のセグメンテーションをほとんど不可能にします。重複する文字の組み合わせの数は、訓練することは事実上不可能です。 'g'と 'y'の文字は最悪の犯罪者です。

これは、おそらくOCRは2行の間隔を空けたバージョンでしょう。

適切な辞書と共に各行を分割して区切ったカスタムソリューションは、結果を確実に改善します。手動で修正するにはまだいくつかのエラーがあります。カスタムルーティンは、アセンダとディセンダを処理し、イメージを線に分割して、適切なOCRエンジンに送ることができます。 1つの方法は、ページ上のすべての文字ブロブを分析し、それを行に割り当てることです。 Leptonica(www.leptonica.com - Cイメージングライブラリ)は、おそらくこの仕事を少し楽にします。

最初に200または300 dpiに解像度を上げないと、私はこれを試しません。

このカスタムソリューションでは、OCRエンジンが最初に不良ジョブを実行した場合、フォントのトレーニングがオプションになります。

Abbyy(www.abbyy.com)またはGoogle Tesseract OCR 3.00は、開始するのに適しています。

これがすべて機能するかどうかは保証されていません。これはOCRにとって非常に難しいページです。あなたはそれを海外で手動で入力する方が良いかどうかを検討する必要があります。処理が必要なページ数によって異なります。

関連する問題