2017-02-13 6 views
0

次のサイトwikipedia Athensから一部のデータを削り取ろうとしています。SelectorGadget非可視要素を選択する

私が興味を持っている要素を選択するためにSelectorGadgetを使用しています。私が取得しなければならない要素の1つは、アテネ市の公式ウェブページ(http://www.cityofathens.gr/)です小さな地図の下に表示されます。 適切なセレクタを見つけるために要素をクリックしているとき、GadgetSelectorは実際には12個のリンクを選択しているセレクタ ".free"を提案します。だから私はページ内の他のリンクを見ることができませんが、それらは選択されていません。誰もこれを解決する方法を提案することはできますか?

ありがとうございます!

答えて

0

あなただけが特定のリンクに興味があり、一般化する必要がない場合は、私たちが使用することができます。

library(rvest) 
# This is the url you provided 
url <- 'https://el.wikipedia.org/wiki/%CE%91%CE%B8%CE%AE%CE%BD%CE%B1' 
a <- read_html(url) %>% 
    # This select only the first node 
    html_node('.free') %>% 
    # Extract the link 
    html_attr('href') 
+0

はご回答いただきありがとうございます!実際、リンクは私が検索に興味のある要素(都市名、人口などが他にもある)の1つであり、いくつかのページ/都市で行う必要があるため、申し訳ありません。しかし、この特定の問題は、この特定のページを思い付いたに過ぎ...他のすべての他の要素のすべての他のページはほぼ完璧に取得されます! –

+0

それから、あなたは何を達成しようとしていますか?他のページはどれですか?これについて何が違うのですか? – GGamba

+0

私はギリシャのいくつかの他の都市についても、ウィキペディアからデータ(都市名、人口、面積、ウェブサイト)を取得する必要があります。しかし、他のすべての都市では、リンクが1つしか選択されていないため、この特定のページでなぜこれが起こっているのかわかりません。 –