2017-06-16 8 views
0

イメージファイルをtess4j maven依存関係を使用してテキストに変換しようとしています。 pom.xmlで
依存関係: -サポートされていないイメージ形式です。 JAI Image I/Oパッケージをインストールする必要があります

<!-- OCR dependency --> 
    <dependency> 
     <groupId>net.sourceforge.tess4j</groupId> 
     <artifactId>tess4j</artifactId> 
     <version>3.4.0</version> 
     <exclusions> 
      <exclusion> 
       <groupId>net.java.dev.jna</groupId> 
       <artifactId>jna</artifactId> 
      </exclusion> 
      <exclusion> 
       <groupId>net.sourceforge.lept4j</groupId> 
       <artifactId>lept4j</artifactId> 
      </exclusion> 
     </exclusions> 
    </dependency> 
    <dependency> 
     <groupId>net.java.dev.jna</groupId> 
     <artifactId>jna</artifactId> 
     <version>4.4.0</version> 
    </dependency> 
    <dependency> 
     <groupId>net.sourceforge.lept4j</groupId> 
     <artifactId>lept4j</artifactId> 
     <version>1.5.0</version> 
    </dependency> 

私のコード: -

public String convertImageToText(String imageFilePath) throws TesseractException { 

    File imageFile = new File("imageFilePath"); 
    ITesseract iTesseract = new Tesseract(); 
    ImageIO.scanForPlugins(); 
    String result = iTesseract.doOCR(imageFile); 
    System.out.println("Converted text is: "+result); 
    return result; 
} 

しかし、私は私のプログラムを実行しようとしたとき、私は常に例外の下に遭遇:

Exception in thread "main" net.sourceforge.tess4j.TesseractException: java.lang.RuntimeException: Unsupported image format. May need to install JAI Image I/O package. 
https://java.net/projects/jai-imageio/ 
at net.sourceforge.tess4j.Tesseract.doOCR(Tesseract.java:215) 
at utilities.HelperMethods.convertImageToText(HelperMethods.java:218) 
at net.sourceforge.tess4j.util.ImageIOHelper.getIIOImageList(ImageIOHelper.java:408) 
at utilities.HelperMethods.main(HelperMethods.java:250) 
at net.sourceforge.tess4j.Tesseract.doOCR(Tesseract.java:212) 
at net.sourceforge.tess4j.Tesseract.doOCR(Tesseract.java:196) 
Caused by: java.lang.RuntimeException: Unsupported image format. May need to install JAI Image I/O package. 
https://java.net/projects/jai-imageio/ 
at utilities.HelperMethods.convertImageToText(HelperMethods.java:218) 
at net.sourceforge.tess4j.util.ImageIOHelper.getIIOImageList(ImageIOHelper.java:408) 
at utilities.HelperMethods.main(HelperMethods.java:250) 
at net.sourceforge.tess4j.Tesseract.doOCR(Tesseract.java:212) 

すべて私のリポジトリにjai、lept4jなどの依存関係が必要です。また、このフォーラムで提案されているすべてのソリューションを試しましたが、このエラーを解決できません。
ご協力いただければ幸いです。

おかげ
アップデート:ここにファイルを添付する - Jpg file

+1

また、どの種類の画像ファイルを読もうとしていますか? – VGR

+0

私はjpgとpngファイルを試しました。両方の形式で同じエラーが発生します。 – Anuja

+0

問題のある画像ファイルの1つをimgurに投稿できますか?それでImageIOで画像ファイルを読み込めますか? – VGR

答えて

0

をそれは与えられたファイルフォーマットに適したImageReaderを決定することはできません。おそらく1)ファイル形式が正しく判別できない(奇妙なファイル拡張子ですか?)か、2)使用しようとしている形式の画像リーダーが登録されていません。

ImageIO.getImageReaderByFormatNameを参照してください。

関連する問題