2012-03-08 9 views
1

私はpdfパーサーを見つけようとしています。私はstackoverflowで検索しますが、満足のいく回答はありません。ある人はZendがそれをするのが良いと言いますが、私はそれを使いたくありません。それを行う良いクラスがありますか?php - pdfパーサー

+1

なぜZendを使いたくないのですか?何か特別な理由、またはすべてのものZendの一般的な嫌悪感? –

+0

私はzendが大きなプロジェクトに適していると思います。私は2つのpdfを読んでほしい。 –

+3

Zend Framework全体をPDFを読むだけで使う必要はありません。必要なコンポーネントだけを選択するだけです。 –

答えて

0

あなたはpdf解析に行く必要があるのか​​分かりませんが、hereは非常に最近私がjson文字列にpdfテキストを抽出するために行ったことです。それはまた、画像を抽出しますが、あなたがそれらをしたくない場合は、あなたはまだはい、それはPHPでpythonではありませんが、あなたができる

extract_images(pdf_file) 
dict_book = get_images_update_dict(dict_book, image_folder) 

pdfreader/main.pyでrun関数に次の2行をコメントアウトすることができます

exec("./parser.py pdfreader/book.pdf './images/' 2>&1", $output); 
$data = json_decode($output) 
var_dump($data);