2016-04-08 18 views
0

Tesseractを使用するアプリを開発する際にいくつか問題が発生します。問題は、高速OCRスキャンに適したイメージを作るための十分に速い方法を見つけられないように見えることです。誰かが速い方法/私が物事をより速く起こすために使うことができる存在するライブラリを指摘できますか?OCRの画像を最適化する

答えて

0

私はTesseractで十分ではないと思います。恐らく、あなたの問題を解決する最善の方法は、あなた自身の高速OCRソリューションです。特に、スキュー除去、トリミング、二値化、接続コンポーネントの検索、シンボル認識、テキストの後処理など、OCRでこれらのステップを高速に行う必要があります。

通常、OCRの最長操作はシンボル認識です。私はあなたがGPGPUを適用することが速くなると思う。

あなた自身のOCR実験を始める前に、領収書認識調査のレビューに慣れることができます:http://rnd.azoft.com/applying-ocr-technology-receipt-recognition/
これは役に立つかもしれません。

0
  1. OpenCV関数adaptableThreshold(...、CV_ADAPTIVE_THRESH_MEAN_C、...)を使用してください。それは速く働く。
  2. より良い2値化アルゴリズムを使用することができます(例:SAUVOLA)。しかしMeanの二進化よりも遅く動作します。ソースを参照してください:https://github.com/benob/opencv-utils/blob/master/include/binarize.h
+0

3.市販のモバイルOCRソリューションを使用することができます – ssasa

+0

モバイルOCRソリューションの例を教えてください。 –

関連する問題