2012-01-15 23 views
17

Wgetを使用してこのページをダウンロードしようとしています。こちらのページリンクは次のとおりです。Wgetを使用してユーザーエージェントを使用してWebページをダウンロードする方法

http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387

そして、ここでは私のCMDです:

のwget -O ebay.html --user-エージェント= "Mozillaの/ 5.0(Windows NTの5.2; RV:2.0.1)Geckoの/ 20100101 Firefoxの/ 4.0.1" "http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&rt=nc&item=250972882769&si=a8iGAIchyvEbn7KveYFZ5QbEE7o%3D&print=all&category=31387"

私はそれが正常に動作し、ブラウザを使用してページにアクセスするためにそれを使用する場合。 Wgetを使用すると、元のページではなく別のページがダウンロードされます。私は問題がユーザーエージェントのためだと思う。解決策は何ですか?

+0

ブラウザでURLを開いたときにFiddlerを使用して、httpリクエストの構造を確認してみてください。 Wgetコマンドにその構造をそのまま模倣してください。 –

+0

あなたは簡単な例を教えてくれますか? – qmaruf

答えて

13

問題はユーザーエージェントではなく、CookieまたはCookieがありません。解決策は

  1. そのHTMLファイルのうち、
  2. 魚、wgetの--save-クッキー=イーベイ、クッキーと「印刷」リンクURLを通常の製品ページを取得しています。 (私は手でこれをしなかった、あなたは明らかにそれを行うためのスクリプトを記述する必要があります。)
  3. 私はランダムでそれを試してみましたwgetの--load-クッキー=イーベイ、クッキーと

を「印刷」URLを取得します製品ページ出来た。

+0

あなたはどのようにeBayクッキーが他のサイトでそれを行う場合に有効にする単語であることを知りましたか –

+2

eBayクッキーはクッキーを保存するために選択したファイルの名前ですあなたが好きな名前を使用してください。重要なのは、サイトクッキーと--loadクッキーを保存してウェブサイトに戻すために--save-cookiesを使用することです。 –

関連する問題