私はOCRされるように写真を撮るためのカメラアクティビティを作成しようとしています。OCRに最適化された/適切なカメラアクティビティの作成
- カメラプレビューの中央にあるサイズ変更可能なボックスで、特定の領域がビットマップに作成され、OCRエンジンによって処理されることを示します。
- 連続オートフォーカス(行われる)
私はところでたTesseractを使用しています。
誰かが参考文献/例/チュートリアルを教えてくれたら嬉しいです。
私はOCRされるように写真を撮るためのカメラアクティビティを作成しようとしています。OCRに最適化された/適切なカメラアクティビティの作成
私はところでたTesseractを使用しています。
誰かが参考文献/例/チュートリアルを教えてくれたら嬉しいです。
ファインダーの四角形がここにあります:
ありがとう、私はtess-two(目2を含む)をフォークしました。私はあまり抽象化されていない例を探していますが。現在、すべての関連クラスを通過しています。 –
私は似た何かをやってきました。今、私はウェブサービスに画像全体を送信し、OCRfeederで処理しています。これは、画像のセグメンテーションを実行し、テキストを含む各部分をtesseractに送信します。私はそのようにずっと良い精度を得ています。さらに、実行したいかもしれません。some preprocessing to clean up the image first.
2つの一般的なアプローチがあります。
OCRエンジンに送信する前に画像のサイズを変更できます。あなたが使用するTesseractエンジンには、ある種の機能があります。文字とイメージの境界線の間にある程度のスペースが必要になることがあります。
2番目の方法は、テキストブロックの座標を指定してフルイメージをOCRエンジンに送信するときにフィールドレベル認識を使用することです。 http://www.ocrsdk.comをご覧ください。これは、最近ABBYYによって開始されたWeb APIを使用したクラウドOCR SDKです。ベータ版であるため、今のところ無料で利用できます。それはfield level recognition methodsとAndroid code samplesを持っています。私は@ ABBYYを働き、必要に応じて私たちの製品に関する追加情報を提供することができます
私はいくつかのソースにリンクして、カメラのプレビューの途中にサイズ変更可能なボックスを作成して、 OCRエンジンによって処理される。 –