2017-01-25 20 views
1

(直接)URLからpdf文書のタイトルを抽出する必要がありますので、私はhttp://somepagehere/something/something.pdfのURLを受け取ります。このpdf文書のタイトルのみを抽出する必要がありますドキュメント全体をダウンロードする必要があります。URLからPHPのPDF文書からタイトルを抽出

私はZend Frameworkには、この機能に似て何かをしていることがわかり

:しかし、私は通常のPHPでこれをどのように

$pdf = Zend_Pdf::load($pdfFilePath); 
$title=$pdf->properties['Title']; 

を行うのですか、と私は(ダウンロードする必要がないだけで、URLをので、どのように行うのですかドキュメント全体)?ありがとう。

答えて

0

は、あなたが、残念ながら処理するためのプラグインが必要です - - それは通常のPHP(簡単に)で行うことはできません。しかし、そこから選択するプラグインの多くはだ、とあなたの使用量が他よりも1は、多くの適用にすることがあります。

  • ApacheFOP
  • DOMPDF
  • FPDF
  • html2ps
  • MPDF
  • PDFlibの
  • TCPDF
  • wkhtmltopdf
  • Zend_Pdf

実際のタイトル抽出については、アプローチを強くお勧めします。 PDF全体を読み込んだら(残念なことにあなたがしなければならない)、次のようなものが必要です:

希望します。

0

basename()をお探しですか?

echo basename($pdfFilePath); 

が返されます:あなたは、ドキュメント自体(というよりPDFファイルの名前)にタイトルを抽出するために必要と仮定すると、

something.pdf 
+0

いいえ、まあまあ、basenameは最後の手段であるURLから名前を抽出しますが、実際のpdfのtitleプロパティを抽出するのは、http:// alex .smola.org/drafts/thebook.pdf、ここでは、basenameは "thebook"のみを返しますが、文書のタイトルは "AnIntroductiontoMachineLearning - thebook" ... –

+0

その場合、答えはnoです - ダウンロードする必要があります文書を取り出し、ライブラリを使用してタイトルを抽出します。 – markt

関連する問題