私はPDFBox 1.8.10をJavaで使って簡単なテキスト抽出方法を実装しました。私はPDFBox 2.0.2にライブラリをアップグレードする必要があるいくつかの理由の原因。 PDFTextStripper()メソッドが削除されたか、別のパッケージが新しいバージョンに置かれている可能性があります。この問題を解決する方法はありますか?または、PDFからテキストを取得する別の方法を提案できますか?事前にPDFBox 2.0.2でテキストを抽出するクラスがありませんPDFTextStripper()
public String extractTextFromPdf() {
File jInputFile = new File("c:/lorem/ipsum.pdf");
PDDocument PDDoc = PDDocument.load(jInputFile);
String strContent = new PDFTextStripper().getText(PDDoc);
PDDoc.close();
return strContent;
}
ありがとう:
は、ここに私のコードです。
このそれをしようか? Netbeansでは、Ctrl-Shift-Iを押すと、インポートが自動的に固定されます。 eclipseで、Ctrl-Shift-Oを押します。 –
@TilmanHausherrありがとうございました。私は日食を使用しています。再起動後、修正されました。私は一時的なエラーだと思う。 PDFBoxはPDFTextStripperクラスを 'org.apache.pdfbox.util'から 'org.apache.pdfbox.text'パッケージに移動しました。どのような開発... – brootforce
喜んでそれが動作します。あなたの質問を削除してください。これはあまり意味がありません。または、自分で答えてください。 –