2016-12-10 8 views
1

のためのように私は、フォーマットにありますいくつかの生のスプレッドシートのデータを持っている:これらのデータポイントが一定の間隔でサンプリングされていませんが、ランダムに一日を通して収集され量子化タイムラインデータの平均とヒストグラム

12/7/2016 3:07:00, 88.05, 
12/7/2016 3:08:00, 89.10, 
12/7/2016 3:13:00, 87.00, 
etc 

Googleドキュメント内のGoogleスプレッドシートを使用して、これをタイムラインチャートに簡単にグラフ化できます。これにより、値がタイムライン上の正しい位置に置かれ、不均一なサンプリング間隔が考慮されます。

タイムラインを考慮してタイムラインデータのヒストグラムを生成し、タイムフレーム上の平均値を計算したいと考えています。内蔵のヒストグラムチャートを使ってこれを実行したり、データ値を選択して平均化関数を実行するだけでは、不平等なサンプリング間隔によって歪んでしまいます。

ヒストグラムと平均を生成するためのサンプリング間隔(Googleシート内が理想的)を量子化する最も簡単な方法は何ですか?または、タイムスタンプデータを考慮しながらヒストグラム/値の平均を生成し、量子化されたデータの必要性を排除するビルトインメソッドがありますか?

答えて

1

次のように(データを想定する範囲A2内である:B50)を適当な平均値を計算することができる。この式はTrapezoidal ruleを実装

=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2) 

を各時間間隔に割り当てられた値は、観測値の平均でありますその間隔の終わりに。

ビルトインの「加重ヒストグラム」ツールがないため、代表的なヒストグラムを作成するには再サンプリングが必要です。再サンプリングの方法の1つがここにあります。たとえば、20個のサンプルが必要です。 C2で

=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19) 

を入力して、均一に分布した時間値を20にします。 (フェンスとポストの区別のために19で除算します)。次に、D2では、

=arrayformula(vlookup(C2:C21, A2:B50, 2)) 

が各サンプル時間の値を検索します。その後、列Dからヒストグラムを作成することができます。

+0

魅力的なように働いた!ありがとう! – arby

関連する問題