2016-07-03 16 views
0

以下のコードはDOM内の各要素をループし、各要素をExcelシートに配置します。VBAスクレープ:各html要素からhrefを取得

私の質問(などtagNameを、ID、クラス名)、次のとおりです。

は、どのように私は、各要素のタグattibutes(タイトル、HREFなど)を削ることができますか? 特に、「A」タグの場合、「href」属性をどのように削ることができますか?

Enum READYSTATE 
    READYSTATE_UNINITIALIZED = 0 
    READYSTATE_LOADING = 1 
    READYSTATE_LOADED = 2 
    READYSTATE_INTERACTIVE = 3 
    READYSTATE_COMPLETE = 4 
End Enum 

Dim ie As InternetExplorer 
Dim html As HTMLDocument 
Dim RowNumber As Integer 
Set ie = New InternetExplorer 

ie.Visible = False 
ie.navigate "www.somesite.com" 

Do While ie.READYSTATE <> READYSTATE_COMPLETE 
    Application.StatusBar = "Connecting..." 
    DoEvents 
Loop 

Set html = ie.document 

RowNumber = 1 
For Each element In html.all 
    Cells(RowNumber, "A").Value = element.tagName 
    Cells(RowNumber, "B").Value = element.ID 
    Cells(RowNumber, "C").Value = element.className 
    Cells(RowNumber, "D").Value = element.innerHTML 
    RowNumber = RowNumber + 1 
Next element 

助けてください。

答えて

2

RowNumber = RowNumber + 1前にこの行を追加します。

If (element.tagName = "A") Then Cells(RowNumber, "E").Value=element.getAttribute("href") 
関連する問題