私はTesseractを使用していますが、非テキスト領域とターゲットテキストのみを無視するかどうかはわかりません。より良い出力のために前処理ステップとして非テキスト領域を削除する必要がありますか?Tesseractは、スキャンされた文書の非テキスト領域を無視しますか?
2
A
答えて
2
Tesseractは、テキストを検出するアルゴリズムはかなり優れていますが、最終的には偽陽性の一致が得られます。
理想的には、イメージをtesseractに送信する前に事前処理します。いくつかの時間前、私は同様の作業に従事し、私はあなたが以下の資料を見てみましょうお勧め:
関連する問題
- 1. PDF文書に無制限のテキスト領域を追加する
- 2. cinは文字を無視しますか? !!!無視されたeof文字の-0の値を返す
- 3. テキスト領域のキャリッジリターン
- 4. テキスト領域の値が設定されていませんか?
- 5. 変更された領域にテキストを追加するポストコミットフックスクリプト
- 6. イメージの非テキスト領域を削除するためのオープンソースコードですか?
- 7. テキスト領域とハイパーリンク?
- 8. 手書きテキストのためのトレーニングtesseract
- 9. 可視領域を追跡するGoogle MapまたはMapquest API
- 10. Firefoxでテキスト領域が無効になっています
- 11. 非表示のラベルの空き領域を無効にする
- 12. jQueryまたはjavascriptでページの可視領域の中心DIV
- 13. スタック領域としてメモリ領域を使用しますか?
- 14. テキスト領域の変数値
- 15. テキスト領域のJqueryオートコンプリート
- 16. JQueryダイアログまたはboxy可視領域での作成方法
- 17. 重要な領域変更/領域監視
- 18. テキスト領域の列の幅はどれくらいですか?
- 19. JavaScriptを使用してテキスト領域の文字セットを検出します。
- 20. NSAttributedString '\ n'は無視されました
- 21. テキスト領域の小文字のみを対象にする
- 22. 特定の領域をデルファイのtwainでスキャンする
- 23. divをテキスト領域に追加しますか?
- 24. JQueryモバイル100%の高さのページ(可視領域に等しい)
- 25. テキスト領域がタッチされたときにUISearchDisplayControllerがキーボードを表示しない
- 26. jQuery .html()はテキスト領域の値を設定しません
- 27. Flex IFrameコンポーネントが可視領域外にレンダリングされない
- 28. バックグラウンドモードでのiOS領域の監視
- 29. 固定された領域内のテキストを垂直に整列する
- 30. Android invalidate(Rect)は領域全体を無効にします