2011-01-27 5 views
5

この写真の読みを抽出するには、Matlab(またはこれを行うことができる他の言語)で光学式文字認識プログラムを開発する必要があります。写真用の光学式文字認識プログラム

私は約40000の写真が必要なので、プログラムはできるだけ多くの画像ファイルをアップロードできる必要があります。

このタスクの一般的な目的は、写真に示される特定のガスメータから日中のガスの読みを記録することです。現在設定されているウェブカメラで、毎分読み取り値を写真にするようにプログラムされているため、OCRプログラムは、歴史的な日中のガス読み取りデータを持つのに役立ちます。

これを実行するのに最適なソフトウェアはどれですか?これに使用できるオンラインソースはありますか?

+0

何が質問ですか? –

+0

@ Yochai Timmer最後の行:Pありがとうございました.. – Apollon1954

+1

あなたはあなたの支配下にありますか?つまり、適切に見えるようにウェブカメラを配置できますか?余分な照明はありますか? –

答えて

4

次のように私は、基本的な認識の手順を打破したい:

  1. の計算が使用して各桁の分類
  2. を備えアイソ
  3. 画像内メーター表示を探し、数字
  4. をクリーンアップ歴史的な例を使って訓練したモデル

特定の場所のカメラd移動できない場合は、ステップ1は一度だけ実行する必要があります。ステップ2には、コントラストの強調やノイズのフィルタリングなどが含まれます。ステップ3には、「インク」(白)ピクセルの平均やスキューなど、考えられる計算を含めることができます。ステップ4では、1つの数字を '0'、 '1'、... '9'として分類するモデルを使用し、k-最近傍点、ロジスティック回帰、SVM、ニューラルネットワークなどを使用して達成することができます。

+1

アルファベットを0〜9に制限することを忘れないでください。 – Dave

2

Predictorの答えは簡単です:カメラをメーターの真上に置き、十分な光を加え、ディスプレイを分割するためにメーターの周りに明るいピンクの帯を置いてください:)。

これを実行してカムを固定したままにしておけば、手作業のプロセスを1回使用して、後続のすべての画像に適用して数字を分割することができます。照明が良好で一貫性がある場合は、単純なテンプレートマッチングを使用して、セグメント化された数字のそれぞれを識別することができます。

実際には、すべての桁のサンプルを取得すると、より単純なもの(スレッシュホールドされた画像の合計など)でそれらを分類することさえできるかもしれません。

関連する問題