2016-04-03 6 views
1

特定のQuora回答のアップボートとビューデータを取得したいと考えています。私はGoogle SpreadsheetのIMPORTXML関数を使ってこれをしようとしています。これは私が使用していたコードであるUpvotesデータを取得するには:GoogleシートのIMPORTXML関数はいくつかの要素を取得しますが、他の要素は取得しません

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//span[@class='count']") 

を何らかの理由で、これは、メッセージ(インポートされたコンテンツが空である)#関連N/Aを示しています。 Chrome用のXPath Helperプラグインで同じXPathクエリを使用すると、データが取得されます。私はこれを実行する前に、私はまた、同様のコードを使用してこの回答のため、合計のビューを取得しています:

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//div[@class='CredibilityFact']") 

これは正常に動作するように見えます。しかし、最初のものではありません。何が問題なの?

答えて

2

importXMLのボット取得ページは、このサイトの匿名ユーザーです。だから、サイトが匿名の訪問者に示すものだけを得ることができます。ログインしていないブラウザ(またはブラウザの非表示/シークレットウィンドウ)でページを開くと、クラスcountの要素がないことがわかります。アップボットは表示されません。


は一般的に、1は、シークレットモードでページを開くと、その ソースを表示する必要があり、 importXMLが見ているかを確認します。匿名ユーザーとログインユーザーの区別に加えて、多くのサイトでJavaScriptを使用してページが変更されますが、 importXMLボットは実行されません。

関連する問題