2011-02-09 5 views
3

私はたTesseract 3.0.0を使用していますが、私は次のような問題にぶつかった:ノイズの存在下で適切な結果を得るためにtesseractを作成するには?

たTesseractは、 他のフラグメントと合併だそうです認識するためには小さすぎるものがあります。その結果、関連するものは返されません。

以下の画像は3件を示しています。破線の四角形のみがtesseractに渡されます。四角形の上に結果が表示されます(T以上のVは改行を意味します)。

最後のケースが問題です。このような状況でテセラクトを改善するためには、幾分か? OCRが行われる前に

enter image description here

+0

のために働きます。バーコードの場合、それは動作するはずです。 –

+0

これも数字を伸ばし、ある時点では読み込みができないことがあります。また、これは他の場合には機能しません。 – zkunov

答えて

5

は、私の知る限りでは、たTesseractはまだ適切な画像分割を持っていない(または文書分析、それはcommertial OCRアプリケーションで呼ばれているよう。)一般的に、画像はのは、上の分割取得することですテキスト、写真、バーコード、線などを含む別々の領域。次に、テキストアレスにのみOCRを適用し、あなたが今説明した問題に直面しません。

以前のバージョンのTesseractはそのような機能をまったく持っていませんでした.Tesseractは大きなイメージから切り取ったテキストの小さなスニペットで使用すると、ライン認識ツールとしてのみ使用されます。

私は3.0で導入されたものを完全にはフォローしませんでしたが、おそらく既に部分的に存在していますが、明らかに期待通りに機能しません。

OCRopusという別のオープンソースプロジェクトがあります。この問題は、最初のDocument Analisys(別名セグメンテーション)とOCRだけです。彼らの以前のバージョンは、分析のステップが終了した後、実際にOCRのためにTesseractを使用していました。しかし、後に彼らは独自のOCR(これはまだあまり良くありません)を導入し、Tesseractプラグインのサポートを優先順位のリストに移しました。

は、ここでは、実際にあなたの問題に対処するために何ができるかです:

  • あなたのイメージは非常に典型的な構造を持っている場合は、あなたには、いくつかのダムセグメンテーションを行うと、たTesseractに渡す前の画像から身をテキストをカットしようとすることができます。しかし、多種多様な画像がサポートされることを期待している場合は、それを忘れてください。
  • OCRopusをckeckして、イメージのセグメンテーションが機能しているかどうかを確認できます。もしそうなら、時間をかけてOCRopus + Tesseractを一緒に働かせることができます。
  • あなたがしていることが楽しみのためだけでなく、あなたの時間を大切にしているのであれば、ABBYYのような本物のOCRエンジンについて考えることをお勧めします。あなたはもちろん、セグメンテーションとOCRの両方の精度を高め、プロフェッショナルなカスタマーサポートを提供します。

免責事項:私はあなたがイメージを少し伸ばすことによって例1及び2に、それは似て作ることができるABBYY

+0

答えAndreyのおかげで。 V3.0.0のリリースノートには、「重要な新しいページレイアウト解析モジュールが追加されました」と書かれていますが、これはあまり良くないかもしれません。もう1つは、イメージが表す文字、語、行、またはテキストのブロックを表すセグメンテーションモードを設定できることです。私は、 'ブロック'セグメンテーションモードを使用している間、第2の場合と同様に、それらを異なる行として処理する方法があることを期待していました。あなたの提案について:残念ながら、画像の構造は変わります。二番目はエンジン/ライブラリである必要があります。今のところ、私はまだtesseractをあきらめていません。 – zkunov

関連する問題