2012-04-03 11 views
0

どのようにして、pdfファイルの内容をPythonで1行ずつ取得できますか?私はstackoverflowで検索したが、良い答えが見つかりませんでした。メモ:pyPdfは、可能であればslateとpdfminerでアサーションerroを与えます。あなたはその後、ちょうどそれが作り、あなたが効率的になりたい場合は、pdf2txt.pyを変更しなければならない、とoutfpが可能いるfor line in file:python pdf行by行

を使用したテキスト・ファイルを取ることができpython /path/to/pdf2txt.py -o text.txt /path/to/yourpdf.pdf

:コマンドラインから

答えて

0

Pythonのiostringはファイルを作るのを避け、それから読み込みます。