2017-08-10 7 views
0

Python PDFMiner packageの良いAPIの定義はありますか?PDFMiner APIの定義はどこにありますか?

たとえば、LTTextにx0, y0, x1, y1と何らかのテキストが含まれていることがソースコードからわかりますが、テキストを返す方法はget_text()ですが、x0 ...に直接アクセスする意図はありますか?

その場合、なぜ_textとget_text()を使用してテキストを折り返しますか?

答えて

0

プロジェクトは大きく文書化されていないので、あなた自身で把握しなければなりません。しかし、主なクラスと構造の基本的な説明の形でsome documentationがあります。あなたの具体的な質問については

、抽象基底クラスのようなLTText機能。 LTTextオーバーライドget_text方法を継承し、LTTextContainerのような、より複雑な何かをするいくつかのオブジェクト:

class LTTextContainer(LTExpandableContainer, LTText): 
    def __init__(self): 
     LTText.__init__(self) 
     LTExpandableContainer.__init__(self) 
     return 

    def get_text(self): 
     return ''.join(obj.get_text() for obj in self if isinstance(obj, LTText)) 

通常getterメソッドとsetterメソッドはサブクラスでオーバーライドしたり、入力に依存状態を更新することが有用であり得る機能をラップします。たとえば、LTComponent.set_bboxは、self.bbox以外の6つの属性を更新します。

関連する問題