PDFBox 2.0.2でテキストを抽出するクラスがありませんPDFTextStripper（）

私はPDFBox 1.8.10をJavaで使って簡単なテキスト抽出方法を実装しました。私はPDFBox 2.0.2にライブラリをアップグレードする必要があるいくつかの理由の原因。 PDFTextStripper（）メソッドが削除されたか、別のパッケージが新しいバージョンに置かれている可能性があります。この問題を解決する方法はありますか？または、PDFからテキストを取得する別の方法を提案できますか？事前にPDFBox 2.0.2でテキストを抽出するクラスがありませんPDFTextStripper（）

public String extractTextFromPdf() { 
    File jInputFile = new File("c:/lorem/ipsum.pdf"); 
    PDDocument PDDoc = PDDocument.load(jInputFile); 
    String strContent = new PDFTextStripper().getText(PDDoc); 
    PDDoc.close(); 
    return strContent; 
}

ありがとう：

は、ここに私のコードです。

出典

2016-08-01 brootforce

このそれをしようか？ Netbeansでは、Ctrl-Shift-Iを押すと、インポートが自動的に固定されます。 eclipseで、Ctrl-Shift-Oを押します。 –

@TilmanHausherrありがとうございました。私は日食を使用しています。再起動後、修正されました。私は一時的なエラーだと思う。 PDFBoxはPDFTextStripperクラスを 'org.apache.pdfbox.util'から 'org.apache.pdfbox.text'パッケージに移動しました。どのような開発... – brootforce

喜んでそれが動作します。あなたの質問を削除してください。これはあまり意味がありません。または、自分で答えてください。 –

は、あなたが何IDEを使用している

{ 
    PDDocument document = null; 
    document = PDDocument.load(new File("test.pdf")); 
    document.getClass(); 
    if (!document.isEncrypted()) { 
     PDFTextStripperByArea stripper = new PDFTextStripperByArea(); 
     stripper.setSortByPosition(true); 
     PDFTextStripper Tstripper = new PDFTextStripper(); 
     String st = Tstripper.getText(document); 
     System.out.println("Text:" + st); 
    } 
} catch (Exception e) { 
    e.printStackTrace(); 
}`

出典

2016-08-01 09:35:01 SerefAltindal

これは質問に対する答えではありません。さらに、 'document.getClass（）;'は効果がありません。 'if（！document.isEncrypted（））'は必要ありません。 –

PDFBox 2.0.2でテキストを抽出するクラスがありませんPDFTextStripper（）

答えて

関連する問題