2013-02-18 16 views
5

トップレベルのPDFに子PDFが含まれている「パックされたPDF」ファイルのバージョンが送信されました。「パックされたPDF」とは何ですか?どのように読むことができますか?

トップレベルPDFは、主にコンテナとして機能します。このパッキングは、Adobe Readerで常に明白なわけではありません(たとえばpdftkを使用してリンクを表示していない場合など)。私はこの言葉のためのグーグルでも、私の2012年の本(「Whittington」、「PDF Explained」、O'Reilly)でもほとんど見つけることができません。

これはPDFの標準的な部分ですか?もしそうなら、私は指針に感謝します。そして、PDFBoxはそれを分析できますか?コンテナファイルフォーマットとしてPDFを使用すると、PDFの標準的な部分であるかどうか、あなたの質問に関しては

+0

私は埋め込みファイルについて話していると思いますが、私はPDFBoxにはあまりよく慣れていませんが[ここには例があります](http://pdfbox.apache.org/userguide/file_references.html9)。 –

+0

ありがとう@Jesse。あなたは正しいかもしれません(あなたの参照には、誤植があったはずです。http://pdfbox.apache.org/userguide/file_references.html)。私は他のコメントを歓迎するでしょう - それは混乱を引き起こすために十分に広まっているようです。 –

+0

ここで(http://blog.didierstevens.com/2009/07/01/embedding-and-hiding-files-in-pdf-documents/ ")は、ドキュメントを埋め込むためのやや卑劣な方法です。それを検出してください埋め込みがかなり壊れやすい、または邪魔になる可能性があります –

答えて

2

をはい、そうです。 ISO 32000-1:2008は、セクション7.11.4 に埋め込みファイルストリームを記述しています。

最も顕著な

が(参照12.5.6.15、添付ファイル注釈、およびPDFドキュメントの名前辞書のEmbeddedFilesエントリ(PDF 1.4)を介して、全体としてドキュメントに関連するものを参照して、いくつかの文書のページに関連するファイルです7.7.4,名前辞典)。

@ JesseGoodのPDFBoxサ​​イトのPDF File Specificationへのリンクは、後者のものに対処する方法を説明しています。

私はPDFBoxに関して知識が豊富で、他の種類の添付ファイルに簡単にアクセスできるかどうかはわかりません。そうでない場合は、基本的にすべてのページの注釈を繰り返してPDF添付ファイルの注釈を検索し、PDF仕様に従って内容を処理する必要があります。

関連する問題