2011-09-11 69 views
0

私はこのページの画像を取得しようとしている行動方法 - http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&storeId=10161&langId=-1&programId=562&termId=100020629&divisionDisplayName=Stanford&departmentDisplayName=MATH&courseDisplayName=51&sectionDisplayName=01&demoKey=d&purpose=browse美しいスープ列不気味

は、私は通常のurllibはオープンなものを行う(誰もが一緒に従うために起こっている場合は、クッキーを追跡する必要がある)を てみませんかこの

data = soup.findAll("div",{"class":"efMaterialImage left")) 

うまくいきます。

奇妙なことに、私がtest = data.stringを実行して結果を印刷すると、コンソールに「なし」と表示されます。

理由は何ですか?

答えて

1

findAllは、1つの一致ではなく、一致のリストを返します。ただし、Pythonリストには属性 "string"はありません。

代わりにdata[0]を試してください。

編集:タグは、一人の子供とその文字列を持っている場合

文字列のみ動作するようです。 <div>something</div>でも動作しますが、<div><p>something</p></div>は動作しません。 多くのセレクタを使用するか、代わりに.contentsを使用してください。

+0

まだ試してみましたが、それでもまだプリントしません – praks5432

+0

「プリントデータ」はどうですか? –

+0

奇妙なことにsoup.findAll( 'h2'、{"class:" efh2 "}) – praks5432

関連する問題