2017-02-17 5 views
1

これまでは、ライブストリーミングTwitterやFacebook APIとは別のソースからデータをクロールして別のDBに格納しています。その後、ユーザーの行動や他の種類の分析を理解するために、この大きなデータを使用しています。ダークWebページをクロールすることは可能ですか?

私がやっていることは同じですが、ダークウェブページでは、TORエクスプローラでアクセスできるすべてのWebページをクロールしたいと考えています。私はそのようなことについていくつかのブログで検索しましたが、私が見つけたのはそれらのすべてがログファイルだけをクロールしていることです。

ソーシャルメディアプラットフォームのAPIと同じように、暗いWebページをクロールすることはできますか?

答えて

1

はい、それは可能です - 私たちは何年もそれをやってきました。私たちは、私たちは私たちのクローラにTORをインストールUbuntuのを使用します。

apt get install tor

と私たちのPythonスクリプトは、ポート9050

あなたは発展途上のように感じていない場合を介してサービスに対する.onionリンクについてurllibリクエストを実行しますあなた自身のクローラを試してみてください。https://webhose.io

関連する問題