写真用の光学式文字認識プログラム

この写真の読みを抽出するには、Matlab（またはこれを行うことができる他の言語）で光学式文字認識プログラムを開発する必要があります。写真用の光学式文字認識プログラム

私は約40000の写真が必要なので、プログラムはできるだけ多くの画像ファイルをアップロードできる必要があります。

このタスクの一般的な目的は、写真に示される特定のガスメータから日中のガスの読みを記録することです。現在設定されているウェブカメラで、毎分読み取り値を写真にするようにプログラムされているため、OCRプログラムは、歴史的な日中のガス読み取りデータを持つのに役立ちます。

これを実行するのに最適なソフトウェアはどれですか？これに使用できるオンラインソースはありますか？

出典

2011-01-27 Apollon1954

何が質問ですか？ –

@ Yochai Timmer最後の行：Pありがとうございました.. – Apollon1954

あなたはあなたの支配下にありますか？つまり、適切に見えるようにウェブカメラを配置できますか？余分な照明はありますか？ –

次のように私は、基本的な認識の手順を打破したい：

の計算が使用して各桁の分類
を備えアイソ
画像内メーター表示を探し、数字
をクリーンアップ歴史的な例を使って訓練したモデル

特定の場所のカメラd移動できない場合は、ステップ1は一度だけ実行する必要があります。ステップ2には、コントラストの強調やノイズのフィルタリングなどが含まれます。ステップ3には、「インク」（白）ピクセルの平均やスキューなど、考えられる計算を含めることができます。ステップ4では、1つの数字を '0'、 '1'、... '9'として分類するモデルを使用し、k-最近傍点、ロジスティック回帰、SVM、ニューラルネットワークなどを使用して達成することができます。

出典

2011-01-27 22:07:45 Predictor

アルファベットを0〜9に制限することを忘れないでください。 – Dave

Predictorの答えは簡単です：カメラをメーターの真上に置き、十分な光を加え、ディスプレイを分割するためにメーターの周りに明るいピンクの帯を置いてください:)。

これを実行してカムを固定したままにしておけば、手作業のプロセスを1回使用して、後続のすべての画像に適用して数字を分割することができます。照明が良好で一貫性がある場合は、単純なテンプレートマッチングを使用して、セグメント化された数字のそれぞれを識別することができます。

実際には、すべての桁のサンプルを取得すると、より単純なもの（スレッシュホールドされた画像の合計など）でそれらを分類することさえできるかもしれません。

出典

2011-01-28 14:11:48

写真用の光学式文字認識プログラム

答えて

関連する問題