2016-03-30 65 views
5

私はtesseractを使用して新しい列車データを作成します。それでは、以下のウェブサイトに記載された手順に従ってください。unicharset_extractor:コマンドが見つかりません

https://blog.cedric.ws/how-to-train-tesseract-301

私はOS X端末にUnicharsetを実行しながら、私はエラーの下になりました。

コマンド:

unicharset_extractorのeng.micrtest.exp.box

エラー: -bash:unicharset_extractor:コマンド私は、ソフトウェアバージョンの下に使用している

が見つかりません

OS:OSX EIキャプション10.11.1

たTesseract 3.04.01 leptonica-1.72 のlibjpegの8D:のlibpng 1.6.21:libtiffの4.0.6:1.2.5

libにOSXでunchaste_extractorコマンドを実行することが可能である。この?

ありがとうございます。

+0

私はそれがしばらくしていることは知っていますが、あなたの問題を解決しましたか? – PhotometricStereo

答えて

10

問題は "Unicharset_extractor" システムにインストールしていません。だから、あなたはすでにそれをインストールした場合

brew install --with-training-tools tesseract

たTesseractをアンインストールしてくださいトレーニング・ツールINSTALLたTesseractトレーニングツール

をインストールしてください。

UNINSTALLたTesseract

brew uninstall tesseract 

注:トレーニングツールをインストールして、ログに記載された手順に従っている間、ログをお読みください。

トレーニングツールをインストールするにはもう少し時間がかかるので、端末を静かにしないでください。

上記のコマンドを実行する前にHomebrewをインストールしてください。

+1

これを投稿いただきありがとうございます。私は訓練を受けることに近づきましたが、あなたの答えはフィニッシュラインの上に私をもたらしました。 Macの誰かのために、私はhttp://vietocr.sourceforge.net/training.htmlとこの答えを使ってカスタムの 'traineddata'ファイルを作成しました。 – Adrian

+0

フォントファミリの複数のフォーマット(太字、イタリック、ナローなど)を学習しようとしています。これまでは、jTessBoxEditorFXを使ってトレーニングする方法しか見つけられていませんでした。助言がありますか? – Adrian

1

Tesseractトレーニング実行ファイルをビルドする必要があります。通常のTesseract実行ファイルとは別のものです。

https://github.com/tesseract-ocr/tesseract/wiki/Compiling

+0

こんにちは。それは私のシステムにtesseractをクローンしていません。また、私は自分のシステムにtesseractをインストールし、ボックスファイルを作成しました。私の要件は私のOS Xでunicharsetを実行する必要がありますEIcaptain 10.11.1 –

関連する問題