pdfrw

0熱

1答えて

最後の段落の最後の段落の後にテキストを挿入する必要があります。最後の段落の座標を見つけることができるかどうかはわかりません。私が知っているように、reportlabはpdfを扱うのに最も堅牢なライブラリですが、別のライブラリを介して可能であれば問題ありません。また、複製することも可能です（最後の段落の名前やサイズなどのフォント属性を見つけることができますか）。私が持っているもの from r

1熱

1答えて

Pythonを使用してPDFでストリームを検索して識別する

私はpdfから画像抽出を自動化するために約1週間試してきました。残念ながら、私がここで見つけた答えは役に立たなかった。 pypdf2を使用して同じコードで複数のバリエーションを見たことがありますが、いずれも['/XObject']であり、結果はKeyErrorとなります。 pypdf2の辞書では見つからないストリームに隠れているようです（再帰的に構造全体を調べても、私が見つけることができるすべての

0熱

1答えて

ReportLab複数ページのPDFをキャンバスに追加

ReportLabと一緒にPdfReaderを使用して、PDFページを取得して保存する（両方とも成功した）後、複数ページのPDFを取り込み、同様に処理しようとしています。 PDFを一度に1つずつ取り込む方法を知っていますが、複数のページを取り込もうとしています。 from reportlab.pdfgen import canvas from pdfrw import PdfReader fr

1熱

1答えて

ReportLabとpdfrw：スキャンしたPDFをインポートする

以下のコードを使用して、pdfページを既存のキャンバスオブジェクトにインポートしてPDFに保存しようとしています。これは通常正常に動作しますが、スキャンしたドキュメントからPDFを作成してみると、空白のページが表示されることに気付きました。何かお手数ですか？ from reportlab.pdfgen import canvas from pdfrw import PdfReader from

3熱

2答えて

ゴーストスクリプトまたはpython：異なるページサイズのPDFを同じページサイズのPDFに結合するにはどうすればいいですか？

問題のスタックオーバーフローを検索しました。最寄りのリンクは次のとおりです。 How to set custom page size with Ghostscript How to convert multiple, different-sized PostScript files to a single PDF? しかし、これは私の問題を解決することができませんでした。質問は簡単です。どのよ

0熱

2答えて

pdfrwを使用してPDFのテキストを抽出する方法

pdfrwは文書からテキストを抽出できますか？私は from pdfrw import PdfReader doc = PdfReader(pdf_path) page_texts = [] for page_nr in doc.numPages: page_texts.append(doc.getPage(page_nr).parse_page()) # ..or someth

0熱

1答えて

Pythonでテーブル構造のデータをPDFファイルに書き込む方法は？

+----+-----------------------------+ | id | name | +====+=============================+ | 47 | Some textjogjwojgopwgpowmok | +----+-----------------------------+ | 47 | Some textjogjwojgopwg

1熱

1答えて

pdfrw - ページ周りの空白を整える方法

pdfrwで未使用（白）のPDFページの周囲を空白にするにはどうしたらいいですか？たぶん私はすべてのオブジェクトを通過し、ページの境界に最も近い座標を見つけることができる場合...