ブラウザとPython Webオープナー用の異なるTwitter HTML構造

私はTwitterプロファイルからいくつかのデータをダウンロードするスクリプトを作成しています。私は、Pythonのurllib2とBeautifulSoupでページを開くと、別のタグIDとクラスを取得するため、HTML構造がPythonの "ロボット"と比べてウェブブラウザで異なっていることがわかりました。 Webブラウザと同じコンテンツを取得する方法はありますか？ブラウザとPython Webオープナー用の異なるTwitter HTML構造

ウェブブラウザでは解決されたURLがリンクタイトル属性に格納されているため、短いURLを解決する必要があります。

出典

2012-01-07 milano

ほとんどのWebサイトでは、要求に応じてUser-Agentヘッダーに従って応答が調整されます。何も設定されていない場合、これはブラウザではなく、ある種のスクリプトであることは明らかです。おそらく "実際の"ブラウザに幾分似ているUser-Agentヘッダーを設定したいと思うでしょう。これを行うための方法の

多くがここで説明されています。ここChanging user agent on urllib2.urlopenと：Fetch a Wikipedia article with Python

を無関係なノートで、あなたは標準urllib2よりもはるかに優れAPIであるRequestsを、使用することをお勧めします。

出典

2012-01-07 18:48:38