2011-01-23 3 views
4

可能性の重複:
Reading PDF documents in .NetC#のPDF

は、PDFファイルをレンダリングする任意のフリーのライブラリです。私はpdfを解析し、画像とテキストを別々に表示する必要があります... 情報に感謝します!

答えて

5

http://pdfsharp.com/PDFsharp/

これは私が使用してきた1 ..私はこのライブラリを持っている

+2

MITライセンスを使用しています:) – CodesInChaos

+0

FAQから:「PDFシャープを使ってPDFからテキストを抽出できますか? これは低レベルで行うことができます。左上から右下にかけて、単語、段落、ページ全体を返す高水準の関数はありません。私はそのアプローチを試してきました。出力はうんざりです。 – Marc

4

iTextSharpをご覧ください。それはiTextのC#ポートです。 AGPL v3のライセンスを受けています。それはあなたのためにテキストを引き出すことができるはずです。

+1

です! pdfからテキストやイメージを取得する方法の例はありますか? – Evgeny

+2

ここで画像抽出の例を調べてください:http://stackoverflow.com/questions/802269/itextsharp-extract-images –

+4

iTextSharp(5.0より後のバージョン)は、考えられるほど無料ではないかもしれません。詳細は、itextpdf.com/terms-of-useを参照してください。 – Bobrovsky