2017-09-28 6 views
1

私は2つのTIF画像を持っています。最初の画像(a.tif)は次のとおりです。Python OCR Tesseractはシングルチャレクタを認識できません

Single Character Image

と第2の画像(bcd.tifは)

Multiple Character Image

私はA.TXT a.tif 」たTesseractを使用していますです"それはキャラクターと同じコマンドを読み取っていません" tesseract bcd.tif bcd.txt "が働いています。私はstackoverf彼らはそれを実行する方法を解決していませんでした。私たちは、それらのパラメータを追加する必要がある場合?

答えて

0

問題のように見えますが、画像には1文字しか含まれていません。例えば、私はこれらの2つの画像を試しました:

これはうまく動作します。たTesseractは、結果では95%の信頼を報告します。

enter image description here

この1つは動作しません。

enter image description here

IもPageSegModeた画像がSingleCharに設定走査を試みたが、それがスキャンさ結構です。

このコマンドライン引数は、-psm 10である必要があります。これを見てください:https://stackoverflow.com/a/26418458/5894241

関連する問題