2016-09-02 6 views
-2

名前がmarginBeginのクラスがたくさんあります。このコード全体でDateを探したい。私はpython3とbeautifulsoup4を使って私の学校プロジェクトのデータを取得しようとしています

HTMLコード:

<div class="marginBegin"> 
    <dl> 
    <dt><label>Delivered On:</label></dt> 
    <!--fsrHiddenBlockStart--><dd><!--fsrHiddenBlockStart--> 
    Friday, &nbsp;06/17/2016 
    at&nbsp;3:02 P.M. 
     <!--fsrHiddenBlockEnd--></dd><!--fsrHiddenBlockEnd--> 
    </dl> 

マイ結果:

2016年6月17日

+1

コードはどこにありますか? –

答えて

-1

私はこれが動作すると思います。

from bs4 import BeautifulSoup 
import re 
soup = BeautifulSoup(open("file.html")) 
for link in soup.findAll("div", { "class" : "marginBegin" }): 
    string= link.contents[1].findAll("dd") 
    date=re.search(r'(\d+/\d+/\d+)',(str(string[0]))) 
    print(date.group(1)) 
+1

ありがとうsooo sooo –

関連する問題