ベストセラーのようなものはありません。デジタル画像はさまざまなキャプチャデバイスで取得でき、各デバイスには独自の前処理システム(フィルタ)や画像を大幅に変更したり、ノイズを追加することができるその他の特性を組み込むことができます。だから、すべてのケースを別々に扱う(前処理する)必要があります。
しかし、は、例えば、検出を改善するために使用することができるcommmon操作あり、非常に基本的なものは、グレースケール画像を2値化するthresholdを適用する画像を変換することであろう。前に使用したもう1つのテクニックはthe bounding boxで、テキスト領域を検出することができます。画像から騒音を除去するには、侵食/拡張手術に興味があるかもしれません。私はthis postでこれらの操作のいくつかを実証します。今
あなたにできる簡単なアプローチを表示するには、:また
、あなたが見てみる必要があるOCRとOpenCVの程度その他の興味深い記事がありますサンプルイメージで使用する場合は、色を反転してしきい値を適用した結果です。
cv::Mat new_img = cv::imread(argv[1]);
cv::bitwise_not(new_img, new_img);
double thres = 100;
double color = 255;
cv::threshold(new_img, new_img, thres, color, CV_THRESH_BINARY);
cv::imwrite("inv_thres.png", new_img);
ここにサンプル画像をアップロードしてください。リンクは403の禁止を与える – Alupotha