2013-06-04 14 views
6

私は文書上でOCRを実行するアンドロイドアプリケーションを持っています。 イメージをサーバーに送信する前に、イメージのテストをしたいと思っています。 私はそれがサーバーに送信する前にイメージのフォーカスを測定するためのツール/コードがあれば私の質問です。 サーバー側からの処理時間を節約し、送信しないように、画像にフォーカスがない(シャープではない)かどうかを知りたい。 ありがとうございました デビッドOCRの前に画質を確認してください

+0

最近、電話機は高速ですが、クライアントでOCRを実行せずに、*結果*を検証用にサーバーに送信してください。 – bdares

+0

https://github.com/rmtheis/tess-two/blob/master/eyes-two/jni/imageutils/blur.cpp – rmtheis

答えて

2

デビッド、それは良い質問です。より多くのフィードバックを収集する際には、皆様の調査結果を共有してください。

私は、この重要な処理ステップを使用し、いくつかの技術を見てきました。実際には、多くの場合可能ではないベッドの画像を検出または修正するよりも、ユーザーに良い画像を撮るのがずっと簡単です。だから検出はいいですが、それは最初のアクションではありません。画像チェックの前にトリガーできるオプションがたくさんあります。以下にそのリストをいくつか示します。過去に私のために働いた、または私が働いていた人々のために働いていたかについて聞いた(技術的および非技術的な)

テクニック:

  • 振れ検出。画像の撮影時に装置の加速度を使って揺れを確認する。良いアプローチですが、主に明るい照明で動作します。暗い環境では、わずかな振動でも、画像は簡単に汚れます。この方法は、他の方法と組み合わせて使用​​する必要があります。

  • デバイスのバイナリ化。効率的な伝送のために画像を圧縮し準備するだけでなく、テキストの品質をはっきりと見ることができます。暗い背景を持つカラー画像を見ることは、個々の文字の黒と白のエッジを見ることで、個々の文字の鮮明さについてはっきりとしたものではありません。

  • プレビュー画面。ユーザーが撮影した写真を見て、送信しようとしていることをユーザーに許可します。画像をプレビューできるアプリがよく表示されますが、ダブルタップするとズームが無効になっています。あなたが実際にテキストを見ることができないので、(たとえそれが悪い場合でも)どんなテキストでも、小さな画面でよく見えます。

  • 私はそれを「強制プレビュー」と呼びます。写真を撮影した後、好ましくは2値化後、自動的に10倍にズームし、鮮明なテキストが表示されているかどうかを確認するようユーザーに依頼する。侵略的なので、ここでは良いデザインが重要ですが、この方法は必要なステップとして作成できるので信頼性があります。

  • 簡単なガイドの手順...良い写真を撮る方法!一部のアプリでは、最初の実行時に一度だけ表示されます。いくつかのアプリは無効にするチャンスを与えます。私のアプリでは、iOS上で自分のアプリFotoNoteをアップデートした後で、これらの指示を提供した後、品質が大幅に向上しました。

関連する問題