私は50,000 tiffファイルをそれぞれ50,000 txtファイルに一括変換する必要があるという問題があります。私はabbyy finereaderとこれを行うことができるかもしれない他のソフトウェアを知っていますが、無料の解決策が最適です。私はtesseractも研究しています。誰もが、良い品質の出力でこれを自動的に行うためにtesseractを使用するスクリプトやプログラムを知っていますか?私の意見では、事前OCRバッチ処理TIFFテキスト
1
A
答えて
1
で
おかげで、私はたTesseractはあなたが無料のソリューションを見ていたりしていないかどうか、あなたに最高の結果を与えるために起こっていると思います。
1つのファイルを変換する方法を理解してから使用するコマンドをポストバックすると、複数のファイルを処理するバッチスクリプトを簡単にハックすることができます。
3
Tesseractを使用した無料のソリューションについては、ここでは簡単なコマンドラインバッチファイルを使用しています。変数の内容を変更および/または必要に応じてフォルダを作成します。
:Start
@Echo off
Set _SourcePath=C:\tifs\*.tif
Set _OutputPath=C:\txts\
Set _Tesseract="C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"
:Convert
For %%A in (%_SourcePath%) Do Echo Converting %%A...&%_Tesseract% %%A %_OutputPath%%%~nA
:End
Set "_SourcePath="
Set "_OutputPath="
Set "_Tesseract="
+0
私は実際にはLinuxでこれを簡単に行うためのシェルスクリプトを書いています。だから今私の問題はそれ自体がtesseractです。非常に「簡単な」例では、うまく動作します。しかし、私は毎回30のTIFFごとに1つのさまざまなエラーを取得しています。例えば"TIFFディレクトリに必須の" stripbycounts "フィールドがありません。だから私はそれらを解決するためにそれらを一つずつ見つけようとしています – greatodensraven
0
は、たTesseractのJava/.NETフロントエンドをVietOCRを見てみましょう。その機能はあなたのニーズに合っているようです。
関連する問題
- 1. XSLTバッチ処理
- 2. バッチ処理ループ
- 3. Scalaのバッチ処理
- 4. SQLバッチ処理の削除
- 5. バッチ処理のパンデック変換
- 6. Symfony2の - doctrine2バッチ処理
- 7. バッチ処理ビデオ(Matlab) - 問題
- 8. バックボーンjsバッチ処理保存
- 9. QuickCheck 2バッチ処理QuickCheckの
- 10. Facebookのバッチ処理エラー
- 11. symfonyのバッチ処理セキュリティ
- 12. バッチ処理と関数プログラミング
- 13. 分散並列バッチ処理
- 14. バッチ処理phpのfgetcsv
- 15. Oracle SOAでのバッチ処理
- 16. PHP/jQuery/JavaScriptの無料OCR処理API
- 17. 基本的なOCR後処理(スペルチェック)
- 18. 行、OpenCVの列検出(OCR前処理)
- 19. 画像処理/超薄型OCR
- 20. RailsでのCSVアップロードでのバッチ処理とエラー処理
- 21. MSBUILDバッチ処理タスクは、バッチ内の各ステートメントを実行し
- 22. SVCUtilまたはWSDLバッチ処理
- 23. Windows通知サーバーへのバッチ処理
- 24. バッチ処理用ツールEPS to JPG
- 25. Bea Weblogicでのバッチ処理の実行
- 26. バッチ処理、トランザクションをコミットする場合
- 27. Informixデータベース用NHibernateでバッチ処理
- 28. バッチ画像処理cronjob in PHP
- 29. Hibernateバッチ処理を無効にする
- 30. JDBCバッチ挿入例外処理
あなたはtesseractがcommerial toolsよりも良い結果を生み出すと思いますか?あなたはこれまで比較しようとしましたか?ここでは実際の比較を見つけることができます:http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison – Tomato