特定の フォントセットを下の画像 から生成することはできますか?テキストのイメージからフォントを生成
私の考えは、テキストの下に与えられた画像のための特定のフォント を生成 によって手動で画像の部分を選択し、 letter's.Generateのセットにこの のフォントを、それをマッピングし、その後、これを使用することですOCRのために を読むことができます。 の実装を使用して フォントの生成が可能ですか?また、良いOCRを として提案してください。
1
A
答えて
1
ABBYY FineReaderの10が期待される結果よりも良くなりますが、予想通りの文字が触れたときに混乱してしまいます。
問題は、行間隔が小さすぎることです。各行のディセンダは、すぐ下にある行の文字の文字の境界ボックスと重なります。これは、文字が接触して重なっているため、文字のセグメンテーションをほとんど不可能にします。重複する文字の組み合わせの数は、訓練することは事実上不可能です。 'g'と 'y'の文字は最悪の犯罪者です。
これは、おそらくOCRは2行の間隔を空けたバージョンでしょう。
適切な辞書と共に各行を分割して区切ったカスタムソリューションは、結果を確実に改善します。手動で修正するにはまだいくつかのエラーがあります。カスタムルーティンは、アセンダとディセンダを処理し、イメージを線に分割して、適切なOCRエンジンに送ることができます。 1つの方法は、ページ上のすべての文字ブロブを分析し、それを行に割り当てることです。 Leptonica(www.leptonica.com - Cイメージングライブラリ)は、おそらくこの仕事を少し楽にします。
最初に200または300 dpiに解像度を上げないと、私はこれを試しません。
このカスタムソリューションでは、OCRエンジンが最初に不良ジョブを実行した場合、フォントのトレーニングがオプションになります。
Abbyy(www.abbyy.com)またはGoogle Tesseract OCR 3.00は、開始するのに適しています。
これがすべて機能するかどうかは保証されていません。これはOCRにとって非常に難しいページです。あなたはそれを海外で手動で入力する方が良いかどうかを検討する必要があります。処理が必要なページ数によって異なります。
関連する問題
- 1. イメージ内のテキストから単語のイメージを作成する
- 2. イメージからのQRコード生成?
- 3. PHPのテキストからイメージを生成する - 私のオンラインホストで生成していない?ヘルプ
- 4. DICOMイメージの生データからイメージを作成する方法
- 5. Node.js内の複数のSVGグラフィックからSVGフォントを生成
- 6. は、テキストからバーコードを生成し、BASE64
- 7. テキスト用の垂直イメージを生成する
- 8. pdfからのイメージ作成
- 9. 生成のtoString()テキスト
- 10. オフスクリーンNSViewからスケーリングされたイメージを生成
- 11. PHPのImagickイメージから生のイメージを出力します
- 12. 中国語のテキストからスラッグを生成するには?
- 13. iphoneのテキストからpdfを生成するコード
- 14. PHPで生成されたイメージの動的テキストを中央に整列する
- 15. イメージをC#の.dotファイルから作成
- 16. 選択したテキストから脚注を生成
- 17. Androidのテキスト用のArialフォント
- 18. HttpHandlerイメージ生成とレポート作成サービス
- 19. 「オンザフライ」でイメージ名を指定するJavaイメージの生成
- 20. nodejs小さいイメージからイメージを作成しますか?
- 21. フォントHelveticaのすべてのテキストをjQueryのフォントArialにする
- 22. Google EarthのヒートマップのJavaイメージ生成
- 23. フラッシュファイルから300 dpiイメージを動的に生成できますか?
- 24. サーブレットから生成されたGWTイメージのサイズを変更するには?
- 25. バイナリデータからgifイメージを作成する
- 26. iPhone:ワードラップでNSStringからイメージを作成
- 27. データURLからイメージを作成
- 28. nsIBinaryInputStreamからイメージを作成する
- 29. StringからGWTイメージを作成する
- 30. Googleクラウドインスタンスからイメージを作成
@downvoter:説明してください。 – Emil
私はyとg上のそれらの子孫は、ほとんどのOCRプログラムを混乱させると思います。 –
@jcomeau_ictx:良いOCRを使いましたか? – Emil