2010-11-23 10 views

答えて

1

これは、アプリケーション要件によって異なります。

通常、OCRエンジンは、文字、フォント、単語、行または地域情報のみを返すことができます。他の多くのモジュールを追加して最適な結果を得るために調整する必要があります。

まず、カメラのOCRアプリケーションには画像の前処理が必要です。できるだけきれいな画像に背景、ノイズ除去、二値化、サイズ変更などを追加する必要があります。

第2に、テキスト領域を特定する必要があります。アルゴリズムは画像の特徴に依存するだけでなく、OCRの目的にも依存します。たとえば、プレート番号をOCRする必要がある場合は、プレート番号の長さ、幅または高さを使用して、より正確な位置を指定できます。

OCRの後に、いくつかの後処理を追加して、いくつかのOCRエラーを修正することができます。 Abyy、ExperVision、Omnipage、GOCR、Tesseractなどの一般的なOCRエンジンはすべて共通の文書、雑誌または事務用紙に基づいて訓練されています。文書が特殊な場合は、OCRレイヤーに高度なデータ抽出または分析ロジックを設定することができます。

0

http://www.wisetrend.com/wisetrend_ocr_cloud.shtmlでOCR APIを試すことができます。これはモバイルプラットフォームから非常に簡単に使用できるREST APIです。モバイルからの低品質画像に最適なABBYY OCRエンジンに基づいています電話カメラ。 免責事項:WiseTrendは私の会社の顧客です。

関連する問題