2011-12-27 7 views
1

Google Analyticsの統計情報を管理の投稿詳細の横に組み込むためのサイドバーを開発しています。analytics apiサンプルデータを使用した奇妙な結果

google analytics apiを理解するには、Googleが提供するdata feed query explorerを使用していくつかのテストを行いました。

ほとんどのテストの後で、私は実践的な例で再開する奇妙な動作に気付きました。 私はどのキーワードが特定のURLに人を連れて来るのかを知る必要があり、これらのキーワードから何回クリックしたのか知りたいのです。これは私が使用するパラメータのセットです

...毎日、キーワード、毎月のキーワードおよび全体的なキーワード::私はまた、3種類のデータは、これらの情報のために及ぶたい

ids   = <myTableId> 
dimensions = ga:keyword 
metrics  = ga:visits 
segment  = 
filters  = ga:pagePath=~<myUrl>$ 
sort  = 
start-date = 
end-date = 
start-index = 
max-results = 
max-results = 50 

私はデータを取得しようとすると、 1日(例:start-date = 2011-12-27end-date = 2011-12-27)、すべて正常に動作しているようです。

は、例えば、私のURL /programmazione/lo-schiaccianoci-in-3d-andrei-konchalovsky-2-dicembre-2011.filmのために私は次のような結果ました:私は私の時間範囲を拡張する場合、私は奇妙な行動を持っている

ga:keyword                  ga:visits 
---                    ---  
(not set)                  1 
lo schiaccianoci film a roma        1 
lo schiaccianoci film programmazione roma 1 
lo schiaccianoci film roma          1 
lo schiaccianoci programmazione a roma   1 
programmazione film lo schiaccianoci a roma 1 
schiaccianoci film programmazione      1 
schiaccianoci film roma          1 

開始。以前のリクエストの同じ月の全日にリクエストを延長した場合、少なくとも1日に検索されたすべてのキーワード(多分クリック数が高い)があると予想されますが、 「この結果は、サンプリングされたデータに基づいています」という警告):

ga:keyword            ga:visits  
---              --- 
(not set)           31 
lo schiaccianoci film roma 2011 31 

私は(最初の日から、私は、現在の日にページを作成した)総模様データを取得しようとした場合、それがさらに悪化します:データがありません!

私のアプローチには何が問題なのですか?

--- --- UPDATE

私はこのバグレポートを見つけました:http://code.google.com/p/analytics-issues/issues/detail?id=160は は、それが関連していますあなたと思いますか?

答えて

3

データがサンプリングされる場合は、品質が非常に悪くなります。サンプリングは総訪問回数に基づいているように見えるので、リクエストを短期間に減らすと、通常はサンプリングが行われなくなります。 1日のデータだけをリクエストしようとしたときに、これを自分で見たことがあります。

問題を解決するには、複数のリクエストを行い、自分で集約する必要があります。問題は解決できませんが、問題を解決する唯一の方法です。結果セット内のサンプルフラグをチェックし、すべてのクリーンなデータが得られるまでループを繰り返して時間を減らします。

私自身の分析によれば、サンプリングされた訪問回数の40%がサンプリングされていない値から5%以上離れています。それは訪問のためです。一意の訪問者はサンプリングで計算されません(訪問数を返します)。コンバージョンのような小さなデータポイントはさらに不安定になります。

+0

これは本当に明確で満足のいく回答です!ありがとうございました...私の場合、私は少なくとも2日間の範囲を使用してサンプリングされたデータを取得し始めるため、毎月のデータを取得するために30/31のリクエストを行う必要があります。近似されたデータを保存するには... –

+0

1日の範囲としてすべてのリクエストを行うことをお勧めします。GoogleではAPIに毎日何千ものリクエストを許可しているので、これだけであなたの上限に達するとは思わない。 – bkgraham