pypdf2

    0

    1答えて

    郡に基づいてpdfファイルを生成しようとしています。郡ごとに複数のpdfファイルがある場合は、郡キーに基づいてファイルを1つのファイルに追加します。私はキーに基づいて追加するマップを取得するように見えることはできません。生成された最終的なマップは無作為に見え、あまりにも多くのファイルが追加されることがよくあります。私は彼らを正しくグループ化していないと確信しています。私は、キー内の複数の値が複数回

    1

    1答えて

    私はpdfから画像抽出を自動化するために約1週間試してきました。残念ながら、私がここで見つけた答えは役に立たなかった。 pypdf2を使用して同じコードで複数のバリエーションを見たことがありますが、いずれも['/XObject']であり、結果はKeyErrorとなります。 pypdf2の辞書では見つからないストリームに隠れているようです(再帰的に構造全体を調べても、私が見つけることができるすべての

    0

    1答えて

    私はPyPDF2を使用して複数のpdfファイルを処理していますが、スクリプトがどこかでハングします。私が私のコンソールで見ることができるのは、 "offsetと同じ行にあるstartxref"です。私は正しいと警告しています。そうすれば、finallyブロックに戻り、空の文字列を返す必要があります。 何か間違っていますか? import PyPDF2 import sys import os

    1

    1答えて

    これはHow to insert a "missing" page as blank page in PDF with Python?の書き換えですが、PdfFileWriterの追加の方法でこれを実行しようとしています:cloneDocumentFromReader()とaddBlankPage()、これはこのようにはっきりしていなかったからです。 私はそれがページ数が奇数が含まれている場合は、

    -1

    3答えて

    "pdf"ファイルの特定のページからデータを読み込み、Pythonを使用してCSVファイルに書き込むコードを記述しました。それは部分的にしか仕事ではありません。ただし、csvファイルにデータを書き込む場合、通常のパターンではなく、1行に書き込む。目的に合うようにスクリプトを変更するにはどうすればよいですか?前もって感謝します。ここで は、私がこれまで試したものです:PDFで import csv

    2

    1答えて

    ファイルシステムで破損したPDFをチェックする作業を進めています。私が走っているテストでは、ほぼ200kのPDFがあります。これは、破損したファイルの方が正しく警告されるように思えますが、破損している15 MBの大きなファイルを実行したため、コードが無期限にハングアップします。私は運がないとStrict to Falseを設定しようとしました。それは問題の最初の開口部のようだ。スレッドを実行してタ

    0

    1答えて

    https://programtalk.com/python-examples/PyPDF2.PdfFileWriter/(例2)に基づいて、添付ファイルをPDFファイルに追加しようとしています。ここで は、私が実行しようとしています私のコードです: import os import PyPDF2 from django.conf import settings ... doc = o

    0

    1答えて

    私は最初のページと2ページ目のPDFを1ページ目に追加しようとしています。最初のページは2ページ目の上にあり、最初のページに表示されます。 問題は、ページがトリミングまたはマージされていないことです。最後のページは2番目から最後まで、それはそれです。 from PyPDF2 import PdfFileReader, PdfFileWriter output = PdfFileWriter(

    1

    1答えて

    Python 3でPyPDF2モジュールを使用しようとしましたが、「ページサイズ」プロパティを表示できません。 私は、PDFファイルにスキャンする前に紙の寸法を知りたいと思います。 このような何か: import PyPDF2 pdf=PdfFileReader("sample.pdf","rb") print(pdf.getNumPages()) しかし、私は別のPythonの関数には、

    1

    1答えて

    : import PyPDF2 pdfFileObj = open('path', 'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) pageObj = pdfReader.getPage(0) pageObj.extractText() これはページからすべてのテキストを抽出し、私はテキストのみを抽出したいですページの左上部分の3'