2017-02-01 18 views
0

urlparse()を使用してホスト名を抽出した2つのURLがあります。結果は: URL1 = 'ads.indiaresults.com'とURL2 = 'haryana.indiaresults.com'Python URLの比較

ここで、同じドメインまたはウェブサイトからのものかどうかを確認できます。私はいくつかの時間のホスト名が似ているとして、それはすべてのURL上で動作するように一般的な方法を行う必要があります。 (www.google.com、www.e-tutes.com)

+0

?あなたのURL1とURL2は異なるドメインです。 –

+0

'urllib.parse'を使用して等価なフォーマットにします –

答えて

1

これが答えになります

あなたのURLを分割:次に

URL1Split = URL1.split(".") 
URL2Split = URL2.split(".") 

、リストを逆:

01:

a = URL1Split[::-1] 
b = URL2Split[::-1] 

は今、あなただけのドメイン名を取得するために2つの初の項目を選択する必要がありますあなたがしたい場合

domain1 = a[1] + "." + a[0] 
domain2 = b[1] + "." + b[0] 

はここで機能だ: `==`と

def compDom(URL1,URL2): 
    URL1Split = URL1.split(".") 
    URL2Split = URL2.split(".") 
    a = URL1Split[::-1] 
    b = URL2Split[::-1] 
    domain1 = a[1] + "." + a[0] 
    domain2 = b[1] + "." + b[0] 
    if domain1 == domain2: 
     return 1 
    else: 
     return 0 
+0

これまでの作業...もっと多くのインスタンスをチェックします...ありがとう –