RCurl
を使用してデータを抽出したい場合はthis oneのようなリンクがあり、その前に免責条項ページがあり、ブラウザでクリックする必要がありますデータを評価する前に以前私は「バイパス」免責事項のページに、hereからである以下のスクリプトを使用してRCurl
を使用してデータにアクセス:RCurlを使用して「免責事項ページ」をバイパスしてからWeb廃棄する
pagesource <- getURL(url,.opts=curlOptions(followlocation=TRUE,cookiefile="nosuchfile"))
doc <- htmlParse(pagesource)
それは前に働かないが、最近の数日で、それ何の長い作品。実際に私はそれが何をしているかについて多くのアイデアを持っていない、私はcurlOptions
の何かを変更する必要があるのだろうか、またはコード全体を書き直すのだろうか?
ありがとうございました。
これは実際にアクセスしようとしているサイトですか?私はこのソリューションがサイト依存性が非常に高いと思います。 –
@Jeffはい、アクセスしたいページの1つです – lokheart