2016-07-11 3 views
2

私はフットボールのプレイヤーがゲームのリストでプレーしているクラブを掻き出そうとしています(例えば、アラン・シェアラーの場合http://www.transfermarkt.com/alan-shearer/leistungsdatendetails/spieler/3110/wettbewerb/GB1、特にテーブル#3、「プレミアリーグ")テーブル内の指定された列から擦り傷を取り除く

表の" For "列のクラブは、" tiny_wappen "クラスの画像としてエンコードされています。私は私が得るように、この画像のクラスでもある(対)にこれらをこすり、隣接する列内のクラブの

link <- "http://www.transfermarkt.com/alan-shearer/leistungsdatendetails/spieler/3110/wettbewerb/GB1" 
    UrlPage <- read_html (link) 
    Node <- UrlPage %>% html_nodes("table") %>% `[`(3) %>% html_nodes("img.tiny_wappen") 
    ClubFor <- data.frame(html_attr(Node, "alt")) 

が、いくつかの(すべての5人に約1)でdata.frameにそれらを置くことができます対戦したクラブが点在するリスト。テーブルの列を指定して(または私が欲しいものを達成するために他のより巧妙な方法で)捨てるべきかどうかはどこですか?いつものように

は先制のおかげで、

答えて

2

あなたはすべての行の第4のセルをつかむためにxpathsを使用することができます

Node <- UrlPage %>% 
    html_nodes(xpath = "//*[@id='main']/div[9]/div[1]/div[2]/div[3]/table/tbody/tr/td[4]/a/img") 

ClubFor = Node %>% 
    html_attr("alt") %>% 
    data.frame() 
関連する問題