2016-11-29 5 views
1

私は日本語/中国語手紙のような複雑な手紙の認識率を改善しようとしています。OCRの手紙の中央だけを残すために手紙の端を薄くする

左側の文字を作るためにどのような画像処理を行うべきですか?右側の文字は何ですか?

OCR(Tesseractなど)の認識率が改善されるように、文字の中心を維持して(私はそれをどのように呼び出すべきかわからない)、文字を鮮明にするという考えがあります。

このような複雑な文字の認識率を向上させる別の方法がある場合は、同様に知っておくといいでしょう。

Sample letter

答えて

1

あなたはOpenCVのかScikit-画像やMATLABでmorphological operatorsで行うことができますSkeletonizationを探しています。もう1つの選択肢は、distance transformで、次にOpenCV Watershed exampleに示すようなしきい値が続きます。

+0

ちょうど数ピクセルの太い線での形態操作は、形状線の比率を変更することができる形状を歪ませる(線を短くする)ために役立たない。 – Spektre

+0

モルフォロジー演算にはバイナリイメージが必要なので、しきい値処理は必須です。 – Trilarion