2016-04-07 12 views
0

私はvb.netコードを使用してURLからpdfをダウンロードしたいと考えています。このURLは埋め込まれたpdfプラグインを含むページを返します。 PDFを自動的にダウンロードして保存するコードが必要です。ここではサンプルのURLは http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=PK&language=en&productNumber=S9888&brand=SIAL埋め込みプラグインを返すurlからpdfをダウンロード

+0

あなたの質問は、あなたにコードを書くように人々に求めているようです。これはStackOverfloewのためのものではありません。 http://stackoverflow.com/help/how-to-askにアクセスし、質問を適切に編集してください。あなたはより良い結果を得るでしょう。 – DWRoelands

答えて

0
  1. 次に、このように、このdownloadedpage.htmlに対してregular expressionを実行し、この

    Dim myWebClient As New WebClient() myWebClient.DownloadFile("http://example.com/somepage.html", "downloadedpage.html")

  2. ようWebClientを使用して、ソースURLのHTMLソースをダウンロードしてください:iframe.+src\=\"(.+)\":それは最初の一致がPDFファイルのソースとして返されます。あなたはhttp://example.comプラスあなたが2

  3. 最後にステップに抽出されているサブURLを追加することにより、PDFファイルへの最後のリンクを構成Regexp Hero

  4. オンラインで正規表現を演じることができる、あなたがきたリンクから、最終的なPDFファイルをダウンロードステップ上に作成3
+0

ご返信ありがとうございます。私はステップ3まであなたの提案に従い、サブURLを取得しましたが、WebClient.DownloadFile(url、filename)を使用してダウンロードしようとすると、ファイルの代わりに「申し訳ありません、ファイルが見つかりません」というページが表示されます。ブラウザーにサブURLをロードすると、同じページが作成されます。 – Sami

+0

@samiは送信元サーバーが同じサーバーから送信される参照URLまたはヘッダーをチェックしているようです –

関連する問題