PHPドキュメントまたはLinuxライブラリを使用して、PDFドキュメント内のすべてのテキストフィールドのX/Y座標と高さ/幅を取得できますか? PDFTKを使用してPDF内のすべてのテキストフィールドを抽出していますが、座標情報および/または寸法情報が表示されません。そうでない場合は、PDFドキュメントをトラバースして、テキストフィールドのx、y、高さ/幅のデータを計算できますか?テキストフィールドの寸法と座標をPDFで取得
4
A
答えて
0
これは可能ですが、ほとんど実行できません。
FPDIを使用してPHPドキュメントをPDFで開くことができます。メモリ内にPDFオブジェクトの抽象ツリーを生成します。 TCPDFとFPDFはそれを元に戻すことができます。
しかし、ツリーを横断して正しい属性を見つけることは非常にです。 (私は間違いなく動詞)
今、PDF形式は実際に人間が読める形式です。そして、それは確かに座標を可読形式で含んでいます(それは主にIIRCの点にあります)。見た目だけを知っていれば、単純な正規表現でそれを発見するかもしれません。いくつかのノードはgzuncompress()されていなければならず、あなたはその文書を修正したり、元に戻したりしようとしていません。だから、FPDIとprint_r()を試して戦略を考案してください。
0
ええ、あまりにも難しくありません。私が仕事で知っている最高のツールはpdfminerです。それはPythonですが、Pythonを使用したくない場合は、xml形式のpdf情報をダンプして、選択した武器で解析してください:)問題があれば返信してください:)
関連する問題
- 1. PDF内のポイントのX、Y座標を取得する方法
- 2. イメージコントロールでビットマップイメージのx座標とy座標を取得する方法は?
- 3. 座標でセルを取得
- 4. pdfファイルの特定の座標で色を取得する方法
- 5. Android - ビューのx座標とy座標をgridLayoutに取得する方法
- 6. X座標とY座標を取得する
- 7. 回転した左上座標と左座標を取得
- 8. UIImageViewの座標の取得方法は?
- 9. androidのアドレス座標の取得方法
- 10. ボトムy座標の取得方法
- 11. ピンチズーム - タッチ座標の取得
- 12. 座標で地形のタイプを取得
- 13. マップビューのジェスチャで座標を取得
- 14. レイトレーシングのピクセル座標からuvw座標を取得する
- 15. テキストでテキストを座標で取得
- 16. Javaでのコンポーネントの座標の取得
- 17. GridViewのx座標とy座標の項目を取得する
- 18. JavaScriptのx座標とy座標のキャレット位置を取得する
- 19. PDFテキストと座標の解析
- 20. ARToolKitでマーカー座標を取得する
- 21. ハニカムパターンでセル座標を取得
- 22. タッチ入力のx座標とy座標を取得する(Androidスタジオ、Java)
- 23. openGL:glrotateの後に座標を取得
- 24. WP7デバイスの座標を取得する
- 25. フラットインデックスからマトリックスの座標を取得
- 26. 部品のグローバル座標を取得+フレックス
- 27. 現在の座標を取得
- 28. コンポーネントの座標を取得する
- 29. GoogleマップのGPS座標を取得
- 30. DateTimeオブジェクトとGPS座標からTimezoneInfoを取得する方法