2016-08-01 7 views
2

私はPDFBox 1.8.10をJavaで使って簡単なテキスト抽出方法を実装しました。私はPDFBox 2.0.2にライブラリをアップグレードする必要があるいくつかの理由の原因。 PDFTextStripper()メソッドが削除されたか、別のパッケージが新しいバージョンに置かれている可能性があります。この問題を解決する方法はありますか?または、PDFからテキストを取得する別の方法を提案できますか?事前にPDFBox 2.0.2でテキストを抽出するクラスがありませんPDFTextStripper()

public String extractTextFromPdf() { 
    File jInputFile = new File("c:/lorem/ipsum.pdf"); 
    PDDocument PDDoc = PDDocument.load(jInputFile); 
    String strContent = new PDFTextStripper().getText(PDDoc); 
    PDDoc.close(); 
    return strContent; 
} 

ありがとう:

は、ここに私のコードです。

+0

このそれをしようか? Netbeansでは、Ctrl-Shift-Iを押すと、インポートが自動的に固定されます。 eclipseで、Ctrl-Shift-Oを押します。 –

+0

@TilmanHausherrありがとうございました。私は日食を使用しています。再起動後、修正されました。私は一時的なエラーだと思う。 PDFBoxはPDFTextStripperクラスを 'org.apache.pdfbox.util'から 'org.apache.pdfbox.text'パッケージに移動しました。どのような開発... – brootforce

+0

喜んでそれが動作します。あなたの質問を削除してください。これはあまり意味がありません。または、自分で答えてください。 –

答えて

0

は、あなたが何IDEを使用している

{ 
    PDDocument document = null; 
    document = PDDocument.load(new File("test.pdf")); 
    document.getClass(); 
    if (!document.isEncrypted()) { 
     PDFTextStripperByArea stripper = new PDFTextStripperByArea(); 
     stripper.setSortByPosition(true); 
     PDFTextStripper Tstripper = new PDFTextStripper(); 
     String st = Tstripper.getText(document); 
     System.out.println("Text:" + st); 
    } 
} catch (Exception e) { 
    e.printStackTrace(); 
}` 
+1

これは質問に対する答えではありません。さらに、 'document.getClass();'は効果がありません。 'if(!document.isEncrypted())'は必要ありません。 –

関連する問題