2012-03-28 30 views
13

linuxにはpdfファイルから図形を抽出してベクトル形式で保存するコマンドラインツールがありますか?私はpdfimagesについて知っていますが、それはビットマップを作成し、それは私が必要とするものではありません。 画像だけのためpdfファイルからベクトル画像を抽出する

答えて

14

ない、あなたが必要とするように見えるよう、しかし

  • pdftocairo

http://poppler.freedesktop.org/

http://www.manpagez.com/man/1/pdftocairo/(manページ)

あなたはベクトル化イメージでPDFページを持っていると仮定しPS/EPS/SVG

のような他のベクター形式にPDFページをレンダリングすることができ、あなたは、SVG、その後、あなたがいるだけで、画像をコピーするために、このページをレンダリングすることができます興味が

注:pdftocairoマルチSVG

あなたはこのページの範囲を選択して、単一のPDFページ

をにPDFページをバーストする最初の必要があるいくつかのPDFページをSVGに変換する必要がある場合に複数ページのPDFをレンダリングすることはできません

例(私たちはSVGにPDFファイルのページ1-10を変換する必要がある場合)

pdftk file.pdf cat 1-10 output 1-10.pdf

pdftk 1-10.pdf burst

for f in *.pdf; do pdftocairo -svg $f; done

最後に、sodipodiやInkscapeで、あなたが画像を抽出することができますが、SVGレンダリングされたPDFのページ

+0

コメントありがとうございます!私が探していたのは、pdfファイルを取り込み、それに含まれるすべての図を返すツールです。pdfimagesと同じように、例外として、ベクタイメージはベクタイメージとして返されます。 – v923z

2
から興味を持っています

This articleは、ツールgpdfx、inkscape、およびpdf2sについて説明していますvgは完全にコマンドラインベースではありませんが、依然として役立ちます。

3

「フィギュア」とは何でしょうか?これはPDFには存在しない概念です。画像がPDFファイルから抽出できるツールが非常に多い理由は、画像が非常にはっきりと識別されたエンティティであるためです。

しかし、あなたの "数字"ははるかに明確ではありません。 PDFファイルには、数字と呼ばない多くのベクトルコンテンツが含まれている場合があります。たとえば、テキストをストロークすることができます。これはベクトルアートになり、それがあなたの図と混同される可能性があります。他の装飾的な要素をページの背景に使用することができる。テキストには下線が引かれているので、ベクトル要素になります。

他の方向では、 "figure"にはテキストであるキャプションが含まれている可能性があります。

PDFは図の概念を持たないため、PDFページでアイデアを分離する方法を理解する必要があります(おそらく、作成アプリケーションがメタデータを追加するか、または...それらを分離することができれば、ページに関係のないすべてのものをトリミングして、EPSまたはSVGとして必要なものをエクスポートすることができます。

関連する問題