2016-12-19 25 views

答えて

0

あなたはTesseractから返された.hocrファイルを調べる必要があります(詳細はgoogle hocrを参照してください)。 .hocrには、テキストのすべての境界ボックス(x、y、幅、高さ、言語など)が含まれます。次に、すべてのボックスを入力から取得した座標の中に配置します。

参考: http://gamemath.com/2011/09/detecting-whether-two-boxes-overlap/

更新

私はあなたのためにいくつかの研究をしました。ここ あなたは& Q✓

https://github.com/search?utf8= Githubの

に見つけることができますJavaScriptで "最良"(ほとんどの星)githubのレポ=たTesseract +言語%3Ajavascript

と最良のものは10000以上の星としてtesseract.jsされていますまだ有する部品I最近

https://github.com/naptha/tesseract.js

enter image description here

をコミット強調表示(tesseract.jsがそれhtml命名)

+0

node-tesseractも使用すると.hocrファイルが存在しますか? (npmから入手したパッケージ)どのようにアクセスするのですか? – Amy

+0

私の答えが更新されました。私はnodejsを書いてnode-tesseractを使用しないので、これに対して答えられません。 –

0

私はしかし、私は同じ要件を持っていた私は、モジュールを変更し、Gitリポジトリ上に掲載しましたので、解決策を見つけることができませんでした、これは古いスレッドですけど.hocrです:

https://github.com/desmondmorris/node-tesseract/issues/46

関連する問題