2016-11-11 10 views
1

nytimesや保護者のようなFacebookのページからFacebookのコメントとIDを分析目的で削り取る方法はありますか?nytimesや保護者のようなFacebookのページからFacebookのコメントやIDを分析目的で掻き取る方法はありますか?

+0

*要求*モジュールを使用できます。ページ構造がJavascriptに大きく依存する場合は、* Selenium *モジュールを使用してPythonからWebブラウザを制御する方がよいでしょう。もちろん、当然のことながら、ウェブページから情報を抽出することもできます。 – Ukimiku

答えて

0

スクレイピングの場合、クイックアンサーはnoです。 APIを使用してください。私はこの質問がPython用であることを知っていますが、Rを使用する場合は、getPage()getPost()という機能を持つRfacebookパッケージがあります。これらの組み合わせ(つまり、ページを取得してポストIDをループさせて、getPost()でコメントを取得してコメントとコメントを取得する必要があります)が必要です。申し訳ありませんが、Pythonに似たものがあるかどうかはわかりません。

-2

あなたはこのXPathの

これを確認することができますがコメントである // *これはコメントヘッダである/ DIV [3] /記事/ P

[ID = "コメント" @] // * [@ id = "comments"]/div [3]/article/

関連する問題