私は文書上でOCRを実行するアンドロイドアプリケーションを持っています。 イメージをサーバーに送信する前に、イメージのテストをしたいと思っています。 私はそれがサーバーに送信する前にイメージのフォーカスを測定するためのツール/コードがあれば私の質問です。 サーバー側からの処理時間を節約し、送信しないように、画像にフォーカスがない(シャープではない)かどうかを知りたい。 ありがとうございました デビッドOCRの前に画質を確認してください
答えて
デビッド、それは良い質問です。より多くのフィードバックを収集する際には、皆様の調査結果を共有してください。
私は、この重要な処理ステップを使用し、いくつかの技術を見てきました。実際には、多くの場合可能ではないベッドの画像を検出または修正するよりも、ユーザーに良い画像を撮るのがずっと簡単です。だから検出はいいですが、それは最初のアクションではありません。画像チェックの前にトリガーできるオプションがたくさんあります。以下にそのリストをいくつか示します。過去に私のために働いた、または私が働いていた人々のために働いていたかについて聞いた(技術的および非技術的な)
テクニック:
振れ検出。画像の撮影時に装置の加速度を使って揺れを確認する。良いアプローチですが、主に明るい照明で動作します。暗い環境では、わずかな振動でも、画像は簡単に汚れます。この方法は、他の方法と組み合わせて使用する必要があります。
デバイスのバイナリ化。効率的な伝送のために画像を圧縮し準備するだけでなく、テキストの品質をはっきりと見ることができます。暗い背景を持つカラー画像を見ることは、個々の文字の黒と白のエッジを見ることで、個々の文字の鮮明さについてはっきりとしたものではありません。
プレビュー画面。ユーザーが撮影した写真を見て、送信しようとしていることをユーザーに許可します。画像をプレビューできるアプリがよく表示されますが、ダブルタップするとズームが無効になっています。あなたが実際にテキストを見ることができないので、(たとえそれが悪い場合でも)どんなテキストでも、小さな画面でよく見えます。
私はそれを「強制プレビュー」と呼びます。写真を撮影した後、好ましくは2値化後、自動的に10倍にズームし、鮮明なテキストが表示されているかどうかを確認するようユーザーに依頼する。侵略的なので、ここでは良いデザインが重要ですが、この方法は必要なステップとして作成できるので信頼性があります。
簡単なガイドの手順...良い写真を撮る方法!一部のアプリでは、最初の実行時に一度だけ表示されます。いくつかのアプリは無効にするチャンスを与えます。私のアプリでは、iOS上で自分のアプリFotoNoteをアップデートした後で、これらの指示を提供した後、品質が大幅に向上しました。
- 1. jQuery:送信前に確認してください
- 2. URLを確認してください
- 3. すべてのJquery Ajaxヒットの前にセッションを確認してください。
- 4. BASH:条件をテストする前にエラーを確認してください
- 5. 関数を実行する前にclassNameを確認してください
- 6. RPMをインストールする前にLinuxソフトウェアパッケージを確認してください
- 7. djangoサーバが起動する前に何かを確認してください
- 8. GTK + 3:アプリケーション終了前に確認を依頼してください
- 9. リダイレクト前に安全な接続が確立されていることを確認してください
- 10. MSOアクセスフォームの要素の名前を確認してください
- 11. サブディレクトリ内のディレクトリを動的に確認してください
- 12. 実行時にGCCのバージョンを確認してください
- 13. フラッシュドライブにあるパーティションの数を確認してください
- 14. 定期的にブラウザのアップデートを確認してください
- 15. コアデータにオブジェクトの存在を確認してください
- 16. vbscriptでiis認証設定を確認してください
- 17. 画像ビューに設定されている画像を確認してください
- 18. すべてのデバイスのサポートを確認してください
- 19. msiが実行される前にインストールされている他のアプリケーションを確認してください
- 20. ブロードキャストの前にスレッドが作成され待機していることを確認してください
- 21. 2つの描画可能イメージを確認してください
- 22. 写真に画像があるか確認してください
- 23. すべてのアクティビティでログインを確認してください
- 24. カラムの値をすべて確認してください
- 25. ユーザー入力にエレガントなエラーを確認してください
- 26. フレームキャッシュにあるファイルを確認してください
- 27. 5分ごとにデータベースを確認してください
- 28. 配列に対する値を確認してください。
- 29. ビデオdivの前にimg divがロードされていることを確認してください
- 30. ログイン前にFacebookのユーザーが「登録」されていることを確認してください
最近、電話機は高速ですが、クライアントでOCRを実行せずに、*結果*を検証用にサーバーに送信してください。 – bdares
https://github.com/rmtheis/tess-two/blob/master/eyes-two/jni/imageutils/blur.cpp – rmtheis