2010-12-27 6 views
0

wget: log.txtとdocs.txtの2つのファイルを作成しました。wgetは 'helloworld.doc'の代わりにDL 'downloading.aspx'ですか?

LOG.TXT: docs.txt

--2010-12-27 23:17:12-- http://www.xyz.dk/docs/Getpaper.aspx?id=133337 
Resolving www.xyz.com... 194.152.xx.xxx 
Connecting to www.xyz.com|194.152.xx.xxx|:80... connected. 
HTTP request sent, awaiting response... 302 Found 
Location: /Members/Login.aspx?uri=%2fdocs%2fGetpaper.aspx%3fid%3d133337 [following] 
--2010-12-27 23:17:13-- http://www.xyz.com/Members/Login.aspx?uri=%2fdocs%2fGet$ 
Reusing existing connection to www.xyz.dk:80. 
HTTP request sent, awaiting response... 200 OK 


    Length: 22162 (22K) [text/html] 
    Saving to: `Getpaper.aspx?id=133337' 

     0K .......... .......... .        100% 131K=0,2s 

    2010-12-27 23:17:13 (131 KB/s) - `Getpaper.aspx?id=133337' saved [22162/22162] 

FINISHED --2010-12-27 23:17:13-- 
Downloaded: 1 files, 22K in 0,2s (131 KB/s) 

私がダウンロードしたい文書への正確なリンクで構成されています。たとえば、

http://www.xyz.com/Docs/Download.aspx?id=133337 

wgetコマンドCMD: のwget -c -o /home/repsak/project/log.txt -i /home/repsak/project/files.txt --load-クッキー&

cookies.txt

私はそのリンクをfirefoxにコピーすると、すぐに私のhddに文書を保存します。

wgetを使用してファイルをダウンロードできないのはなぜですか?

ドキュメントはいくつかの異なるjavascriptなどで囲まれているためですか?

<script src="/JS/SessionKeepAlive.js" type="text/javascript"></script><script type="text/javascript">rootPath = '/';</script><script src="/JS/global.js" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=AJEskFl7ncVJKI8lj-G6W4sh9UGvD53tzD78i10-xRRoHxUqVDJRIljLnDg0DEOQRGYBjddkMr2m5q0TwJMrPlh2lCGMwy6AbdKWsBMN3um5o4LnDIcgMmg4eL168e7m3B43U83ZbaGc8s_xVt_vZ2hFvfwQMI0SKfKljmKnwNaVA8FQ0&amp;t=2610f696" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=rrofmak1_XsHrfW-6KRAeAdeT0EQDJa_q326hm5CN4J0GBPhTP11DXVt2G_-CIqhw_AA2r6ANXbqrNBAfZJb87vm9NR16ygl56psOrqjJelzOVuoWI0lSRCCDSP-4J5YJvgxzae_vsLvVJpMHrQ7mXX8_hI1&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=xJYsnwNJqSs6T1dY1nb07O05PCnCv0HENyX8m8oYEpsDloRSVSOdAx2cDOoU25vJhhL8LPwNLRO05Ulu2LIX_37t_cIxCJEobVObp6psUp6DSGmAF0PYpHNyMJzhHg_vUB-QYAsvFcfw6L2JtytlVP2VdrU1&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=FEHpzPdSdYxI2gNT2bbhrwdiJC8UROU832G8EAnbu2x7ZhR5aHCI5gjoLx78FweIGYgh25_PhqZh8pJTkP-Lje-U1nV_YbChpYqSa_Xr0dJziG_pcM9-dscW_4SZOmuS9BJrt1XWtwpxC3ojfQpgFkjvMOM1&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=LMfuWgyYbfToT4AgZFNAGy1lJGHuFpVQsof2PGpAYw3XskDgdZvPcmO4fiqhPgD_Vi435ME1eUBlcv6AZmiY9FidHgAcyhXENHzwrFShjiIALwQTXY5RKXj7HMPZCxSbJ0Cfwgm4Ui03QN33_WpQWHrsuTDHCihktG9HezEENpgLTl-70&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=Mv3loikajFWni9j8CFnlwfW8Axn-lseUIp6tmfkC39-ni6FDU6ysiEhZMCZuzzXVNbXgsmxORQPQMpRI95K7JYp9fVr0FnSeWIkZJwqH_kJi0XG6K51DJIZZss513XX_cJ4bWJyyfNxFjhC1vX1ppFxpXGeb5otT2SRFS6Poz5FXo3aH0&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=Z4q30yfKzHtiFQj5EoeFk6Gjm42O-f-IQalIUwEu9yg-i18Twv_g-ZWXS7yH8Zkccsa1131CCYafYIOA8kV121H6c3gJhGDAmK7rsFyZqQckD1t1J8dNgnYu4SVsHDfwVs62Kq1DtBRqOThGJplgrMusl-vWwm7aUR_gQfvBWsjYcIBv0&amp;t=7788d8db" type="text/javascript"></script> 

<script src="/ScriptResource.axd?d=SyKM6N5Suv8StxxiOiHTS-b1d5EIBE9i29YIsIhsZsfnNa2wLBxbZxEUH4t2c3xu0IDhDtwtjNlNW_6f0it8BvT_DzWDZTUvavqE6DeLeJY4PURzs1ZqWTWwJARu3Pgs3hQiqo8Z-pEomZIjXmJgNn-39teo7ZhXx2E2k_Rh3u0uARjN0&amp;t=7788d8db" type="text/javascript"></script> 

<script src="../Webservices/MemberVisitcard.asmx/js" type="text/javascript"></script> 

<script src="../Webservices/ToggleNotification.asmx/js" type="text/javascript"></script> 

    <script type="text/javascript" language="JavaScript" src="http://www2.xyz.com/EAS_tag.1.0.js"></script> 
+2

をおそらく:http://www.phantomjs.org/

ここでは、スクレイピングのドキュメントです。 WgetはJavascriptを解析しません。あなたのブラウザはそうします。 –

+0

次にカールを使用できますか? – kaspr

+0

いいえ、カールはJavascriptもパースしません。あなたはこれのために何らかのブラウザを必要とします - 私は、ブラウザがローカルでページを取得して自動的に保存するためのツールがあると確信しています –

答えて