Python PDFMiner package
の良いAPI
の定義はありますか?PDFMiner APIの定義はどこにありますか?
たとえば、LTTextにx0, y0, x1, y1
と何らかのテキストが含まれていることがソースコードからわかりますが、テキストを返す方法はget_text()
ですが、x0 ...に直接アクセスする意図はありますか?
その場合、なぜ_textとget_text()
を使用してテキストを折り返しますか?
Python PDFMiner package
の良いAPI
の定義はありますか?PDFMiner APIの定義はどこにありますか?
たとえば、LTTextにx0, y0, x1, y1
と何らかのテキストが含まれていることがソースコードからわかりますが、テキストを返す方法はget_text()
ですが、x0 ...に直接アクセスする意図はありますか?
その場合、なぜ_textとget_text()
を使用してテキストを折り返しますか?
プロジェクトは大きく文書化されていないので、あなた自身で把握しなければなりません。しかし、主なクラスと構造の基本的な説明の形でsome documentationがあります。あなたの具体的な質問については
、抽象基底クラスのようなLTText
機能。 LTText
オーバーライドget_text
方法を継承し、LTTextContainer
のような、より複雑な何かをするいくつかのオブジェクト:
class LTTextContainer(LTExpandableContainer, LTText):
def __init__(self):
LTText.__init__(self)
LTExpandableContainer.__init__(self)
return
def get_text(self):
return ''.join(obj.get_text() for obj in self if isinstance(obj, LTText))
通常getterメソッドとsetterメソッドはサブクラスでオーバーライドしたり、入力に依存状態を更新することが有用であり得る機能をラップします。たとえば、LTComponent.set_bbox
は、self.bbox
以外の6つの属性を更新します。