私は購入したいいくつかの書籍からいくつかのデータを取得したいと考えています。しかし、そのために私はページのソースコードを取得する必要があり、私はできません。このウェブサイトのソースコードを入手する
exemploのURLは次のとおりです。
http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es
私は、ヘッダーが表示された場合、私はマーク
など、クッキーを受け入れ、カール、wgetの、オオヤマネコにおける様々な可能性を# curl http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es
[1] 1680
[2] 1681
[3] 1682
[4] 1683
[5] 1684
[6] 1685
[7] 1686
[8] 1687
をテストしていますa 302
curl -I 'http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es'
**HTTP/1.1 302 Movido tempor�lmente**
Date: Fri, 08 Jul 2016 09:31:07 GMT
Server: Apache
X-Powered-By: Servlet 2.4; JBoss-4.2.1.GA (build: SVNTag=JBoss_4_2_1_GA date=200707131605)/Tomcat-5.5
Location: http://www.mcu.es/paginaError.html
Vary: Accept-Encoding,User-Agent
Content-Type: text/plain; charset=ISO-8859-1
「 '」「\」を使用すると同じことが起こります。 \ &、wget、lynx -source、クッキーを受け入れるなど。エラーページ(コード302を送信する場所)をダウンロードする唯一のもの
URLのソースコードをダウンロードする方法はわかっています。例? (Bash、PHP、Python、Perl ...)
ありがとうございました。
'curl -Lkg" url "' – 123
こんにちは。 私はあなたが私に教えてくれたカールを試して、別の別のページをダウンロードしました。 カール-Lkg "http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=907145&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es" 2>を/ dev/null | wc 243行。 ..... grep "1973" - >存在しません。 – user1847844
[curlの重複の可能性は、引用符のない400の悪い要求を返す](http://stackoverflow.com/questions/37811962/curl-returns-400-bad-request-without-quotes) –