は、私の知る限りでは、たTesseractはまだ適切な画像分割を持っていない(または文書分析、それはcommertial OCRアプリケーションで呼ばれているよう。)一般的に、画像はのは、上の分割取得することですテキスト、写真、バーコード、線などを含む別々の領域。次に、テキストアレスにのみOCRを適用し、あなたが今説明した問題に直面しません。
以前のバージョンのTesseractはそのような機能をまったく持っていませんでした.Tesseractは大きなイメージから切り取ったテキストの小さなスニペットで使用すると、ライン認識ツールとしてのみ使用されます。
私は3.0で導入されたものを完全にはフォローしませんでしたが、おそらく既に部分的に存在していますが、明らかに期待通りに機能しません。
OCRopusという別のオープンソースプロジェクトがあります。この問題は、最初のDocument Analisys(別名セグメンテーション)とOCRだけです。彼らの以前のバージョンは、分析のステップが終了した後、実際にOCRのためにTesseractを使用していました。しかし、後に彼らは独自のOCR(これはまだあまり良くありません)を導入し、Tesseractプラグインのサポートを優先順位のリストに移しました。
は、ここでは、実際にあなたの問題に対処するために何ができるかです:
- あなたのイメージは非常に典型的な構造を持っている場合は、あなたには、いくつかのダムセグメンテーションを行うと、たTesseractに渡す前の画像から身をテキストをカットしようとすることができます。しかし、多種多様な画像がサポートされることを期待している場合は、それを忘れてください。
- OCRopusをckeckして、イメージのセグメンテーションが機能しているかどうかを確認できます。もしそうなら、時間をかけてOCRopus + Tesseractを一緒に働かせることができます。
- あなたがしていることが楽しみのためだけでなく、あなたの時間を大切にしているのであれば、ABBYYのような本物のOCRエンジンについて考えることをお勧めします。あなたはもちろん、セグメンテーションとOCRの両方の精度を高め、プロフェッショナルなカスタマーサポートを提供します。
免責事項:私はあなたがイメージを少し伸ばすことによって例1及び2に、それは似て作ることができるABBYY
のために働きます。バーコードの場合、それは動作するはずです。 –
これも数字を伸ばし、ある時点では読み込みができないことがあります。また、これは他の場合には機能しません。 – zkunov