私はこのような小さな画像から単語を抽出する必要があります。tesseractはこのイメージでこの単語を認識しないのは普通ですか?
私はこのように、スペイン語の言語オプションを使用して、コマンドラインからたTesseractを使用しています:
tesseract category.png -l spa -psm 7 category.txt
私はこのテキストはと思いますOCRによって解析するのは簡単でなければならないが、その単語は認識されない。私はスペイン語の言語には-l spa
を、-psm 7
を使用しています。イメージには行しかないためです(とにかく-psmパラメータを使用しないと結果は同じです)。
これが結果です:s…"…
私はLANGパッケージにこのビルドを使用しています:http://domasofan.spdns.eu/tesseract/(githubの中に引用された公式のソースを)
あなたが正しいです、私はよりよい結果を得るために各画像のサイズを増やすだけです。 – dlopezgonzalez
私はどのタイプのぼかしを適用したのでしょうか?また、解像度を高めたと言ったときに、サイズ変更を意味するのでしょうか? –