iTextライブラリを使用してPDF文書の各単語の属性(フォント、フォントサイズ、色など)を抽出しようとしています。私はすべてのページからテキストを抽出することができましたが、属性は抽出できませんでした。また、私はそのようなものを提供することができるものは見つけられませんでした。私を助けてください。iTextを使用してpdfファイルからテキストフォントを取得する
答えて
私はJavaの人ではありませんので、私はあなたに作業コードを与えることはできませんが、うまくいけば私はそこに道の95%を得ることができます。メソッドの
PdfTextExtractor.getTextFromPage(PdfReader reader, int pageNumber, TextExtractionStrategy strategy)
ワン:
まず、あなたはその後com.itextpdf.text.pdf.parser.TextExtractionStrategy
あなたは3番目のパラメータとして、このクラスのインスタンスを渡すことができますインターフェイスを実装するクラスを作成する必要がありますは、処理されるすべてのテキストブロックに対して呼び出されるrenderText
です。呼び出されるとTextRenderInfo
が渡され、それにはgetFont
というメソッドがあります。これはあなたが探しているものを与えるはずです。その内容をある種のバッファに格納し、getTextFromPage
の後に、そのバッファを調べて各フォントを見ることができます。そのインタフェースを実装する例を見るには、SimpleTextExtractionStrategy
のコードを参照してください。そうでなければhere's a C# versionあなたが探しているものはかなりです。
こんにちは、お返事ありがとうございました。私は、Javaのコールバック関数の概念(ここでは 'renderText'など)を知らなかった。 "Document Font"のドキュメントに記載されているgetFont()メソッドのオブジェクトにgetFullFontName()を適用してフォント名を取得することができました。 :-) – srjit
- 1. iTextを使用してpdfファイルからデータを抽出する方法
- 2. iTextを使用してpdfを読む
- 3. iTextとPDFライターを使用してpdfファイルにcreationDateを上書きする
- 4. iTextのPDFファイルのリンクを使用してローカルフォルダを開く
- 5. iTextを使用してPDFファイルにフォントを埋め込む
- 6. iTextを使用してWebブラウザ内にPDFファイルを表示
- 7. PDFNetを使用してPDFからURLを取得する
- 8. Perlを使用してPDFからデータを取得する
- 9. androidでiTextを使用してPDFファイルを読むか開きます
- 10. iTextを使用したHTMLからPDFへの変換
- 11. iTextを使用したPDFのHTMLテーブル
- 12. iTextを使用したPDFテキスト抽出
- 13. スクリプトを使用してpdfドキュメントからテキストを取得
- 14. itextsharpを使用してPDFからテキスト段落を取得
- 15. フライングソーサー/ iTextのPDFファイル
- 16. AndroidでiTextを使用してPDFファイルから画像とテキストを順番に抽出する方法
- 17. ITextまたはITextSharpまたはBouncyCastleを使用してpdfファイルからpkcs7(byte [])を抽出する
- 18. How To:C#を使用してmysqlにPDFファイルを保存して取得する
- 19. JavaScriptからPDFファイルのフォームデータを取得
- 20. iTextのは、私がFoxitのフォーム・デザイナを使用して作成されたPDFファイルを持っているPDF
- 21. AJAXを使用してファイルからデータを取得する
- 22. Javascriptを使用してサーバーからファイルを取得する
- 23. Web Workerを使用してファイルからImageImageを取得する
- 24. .getResource()を使用して.jarからファイルを取得する
- 25. itextを使用して画像ファイルをPDFに挿入するときにファイルが見つかりません
- 26. iText(iTextSharp)を使用してXFAフォームフィールドにPDFを埋め込む?
- 27. Java iText APIを使用してSWT画像をPDFにエクスポート
- 28. Javaでitextを使用してxfa pdfフォームを記入
- 29. PHPを使用してMySQLから膨大なデータを取得するPDFファイルを作成する
- 30. iTextSharpを使用してPDFファイルから構造要素を取得することは可能ですか?
[使用されているすべてのフォントがJava iTextでPDFに埋め込まれていることを確認するには?](http://stackoverflow.com/questions/4646130/how-to-check-that-all-used-fonts- pdf-with-java-itextに埋め込まれています) –