2016-08-04 3 views
-3

私は現在Pythonを習得しており、経験豊富なコーダーの助けを借りてこの割り当てを解くことに始まります。Python:zerolengthファイルのファイル名とウェブページ内のすべての画像を数えるスクリプトを記述するスクリプトの作成

  1. os.walkを使用すると、長さがゼロのファイルのファイル名を出力するスクリプトを作成します。長さがゼロのファイルの数も表示する必要があります。

  2. 特定のHTML Webページ/ファイル内のすべての画像を一覧表示してカウントするスクリプトを作成します。

    Each image file is enclosed with the tag <img and ends with > 
        The HTML page/file is syntactically correct 
    

任意の入力がはるかに高く評価されて:あなたがいると仮定することができます!

+1

より良い

はまだ正規表現を使用して実装を持っている私がリンクした、具体的な答え、このSO記事を見てみることであろう。 – DeepSpace

+0

これは本当にコードに対する2つの異なる質問/要求です。私は、ファイルのウォーキングとhtmlのパースに関する既存の質問があると確信しています。例えばhttp://stackoverflow.com/questions/3207219/how-to-list-all-files-of-a-directory-in-python/3207973#3207973次に、ファイルのプロパティのマニュアルを読むことができます – doctorlove

答えて

0

BeautifulSoupを使用すると、ページ上の画像の数を簡単にカウントできます。あなたがする必要があるのは、すべてのタグを掻き取り、その掻き取りの長さを得ることだけです。

import urllib 
from bs4 import BeautifulSoup 

url = 'whatever the website is' 
r = urllib.urlopen(url).read() 
soup = BeautifulSoup(r, 'html.parser') 

num_images = len(soup.find_all('img')) 
print num_images 

このコードはコンパイルされていません。私はそれが完全に正確だとは思わないが、それはあなたにそれを行う方法について十分なアイデア以上を与えるはずです。あなたは、少なくともこれらを解決するために、あなたの試みを示すべきであるhttps://stackoverflow.com/a/17395503/6464893

関連する問題