2011-12-03 30 views
3

OCRエンジンのレイアウト情報をPHPで解析しようとしていますが、詳細はわかりません。OCRエンジンから特定のレイアウト情報を抽出して解析する

私はTesseract(Leptonicaを含む)と楔形の両方をインストールしています。たぶん、楔形文字はレイアウト(テキストとは何か、画像とは何かなど)を検出する上で優れています。テキストと画像の両方を含むPNGファイルです(明らかにテキストは画像の一部です)。

私は出力をtxtまたはhtmlまたはhocrとしたい。私が望むのは、それがテキストであると思うものの座標であり、それがイメージであると考えるものである。

楔形文字は「ネイティブ」出力オプションを持ちます。これはCuneiform 2000形式で、メモ帳で開くことができます。++は圧縮されていることがわかります。私はzipとgzipでそれを抽出しようとしましたが、どちらもそれを認識しません。ネイティブの楔形文字形式に関するGoogleの情報もありません。

TesseractやCuneiformからレイアウト情報を抽出する方法を知っている人はいますか?また、テキストブロックや画像を含む画像のレイアウトを把握するための良いアイデアはありますか?

答えて

3

ABBYY FineReader Engineをご覧ください。それは、座標を含む、認識されたテキストに関する最大の情報を提供する非常にスマートなAPIを持っています。無料ではありませんが、ビジネスソフトウェアに関しては、ABBYY OCR技術は貴社の製品に深刻な価値を与えることができます。

PHPでWebアプリケーションを作成しているので、ABBYY OCR EngineのWeb APIをwww.ocrsdk.comで使用したい場合があります。今はクローズドベータ版だから、今は自由に使える。

+0

ABBYYはレイアウトが優れていますが、高価です。私は可能な限り迅速かつ低コストで対応しようとしています。速度が十分に速いか、または私の目的にとって実用的であるのに十分なほど安いかはわかりません。しかし、それは無料のベータ版なので、私はサインアップし、私はそれをテストします。情報をありがとう! – Alasdair

+0

あなたがABBYYで働いている場合は、締め切りになってから私のベータ版のリクエストを押してください。すぐに受け入れられない場合は、別の解決策で解決します。名前:Alasdair、共通の名前ではありません。ありがとう。 – Alasdair

関連する問題