私はpdfファイルを持っています。 私はAcrobat ReaderとSkimでしか検索できません。端末のpdfファイルの内容を検索できません
端末でPDFファイルの内容を検索するにはどうすればよいですか?
より良い質問は、検索は、Acrobat ReaderやAcrobat脱脂などのPDFビューアで行われている方法
ているようですか?
このようなツールが存在しない場合は、おそらく、私はそのような検索ツールを作成する必要があります。
私はpdfファイルを持っています。 私はAcrobat ReaderとSkimでしか検索できません。端末のpdfファイルの内容を検索できません
端末でPDFファイルの内容を検索するにはどうすればよいですか?
より良い質問は、検索は、Acrobat ReaderやAcrobat脱脂などのPDFビューアで行われている方法
ているようですか?
このようなツールが存在しない場合は、おそらく、私はそのような検索ツールを作成する必要があります。
通常、PDFファイルは圧縮されています。 Acrobat ReaderやSkimなどのPDFビューアでは、PDFテキストをメモリに展開し、そのテキストを検索してコンテンツを検索します。コマンドラインから検索する場合は、pdftkを使用してPDFの解凍を行い、次にgrep
(または好きなコマンドラインテキスト検索ユーティリティ)を使用して、目的のテキストを探します。たとえば:
# Search for the text "text_to_search_for", and print out 3 lines of context
# above and below each match
pdftk mydoc.pdf output - uncompress | grep -C3 text_to_search_for
pdftotext
は本当に優れたツールですが、非常に長い行が生成されます。 grepのために、あなたはそれらを分割したいと思うでしょう。例えば、
pdftotext drscheme.pdf - | fmt | grep -i spidey