イムは、今の問題は、これらのxmlですファイルサイズはそれぞれ約30Mbです。ダウンロードには約1分かかりますので、もっと速くダウンロードする必要があります... urllib.urlretrieve
を使用してダウンロードします。高速ダウンロードxmlファイル
それらのデータベース内にURLが含まれているxmlデータベースを構築するには、これらのファイルが必要です。読み込みを試みましたが、urllib.urlopen
でドローロードするよりも高速である必要があります。
これらのファイル(ダウンロードまたは読み取り)を使用して、より高速なパフォーマンスでデータベースを構築するアイディアがありますか?
注:ちょうどそれらのファイルを使用する必要がある、私はすでに、高速私のデータベースを構築するコードを書く
私はOS XとLinux(VMで実行している)、および優れたを使用してFirefoxを介したウイルスのXMLをダウンロードしようとしました
あなたが言及しているサイトにはログインが必要なので、他の人がダウンロード速度をテストする方法はありません。 Webブラウザや、 'wget'や' curl'などのコマンドラインツールを使ってダウンロードを高速化しますか?サーバーが単にダウンロード速度を抑制することができるかもしれません。 – MattDMo
あなたはログインする必要はありません。サイトにログインせずにこのファイルをダウンロードします... http://support.clean-mx.de/clean-mx/viruses.phpとhttp://support.clean-mxを見てください。 de/clean-mx/phishing.php私はちょうどxmlを追加して、サイトはxml出力を返します(xml出力と同じクエリを参照してください) また、私はwgetを介して試してみましたが、 'urllib.urlretrieve' –
なぜそれらをより速くダウンロードする必要がありますか?一度ダウンロードするだけで十分です(あなたの用途に応じて)。ファイルを頻繁にダウンロードするのではなく、別の方法がありますか? – syntonym