量子化タイムラインデータの平均とヒストグラム

のためのように私は、フォーマットにありますいくつかの生のスプレッドシートのデータを持っている：これらのデータポイントが一定の間隔でサンプリングされていませんが、ランダムに一日を通して収集され量子化タイムラインデータの平均とヒストグラム

12/7/2016 3:07:00, 88.05, 
12/7/2016 3:08:00, 89.10, 
12/7/2016 3:13:00, 87.00, 
etc

。

Googleドキュメント内のGoogleスプレッドシートを使用して、これをタイムラインチャートに簡単にグラフ化できます。これにより、値がタイムライン上の正しい位置に置かれ、不均一なサンプリング間隔が考慮されます。

タイムラインを考慮してタイムラインデータのヒストグラムを生成し、タイムフレーム上の平均値を計算したいと考えています。内蔵のヒストグラムチャートを使ってこれを実行したり、データ値を選択して平均化関数を実行するだけでは、不平等なサンプリング間隔によって歪んでしまいます。

ヒストグラムと平均を生成するためのサンプリング間隔（Googleシート内が理想的）を量子化する最も簡単な方法は何ですか？または、タイムスタンプデータを考慮しながらヒストグラム/値の平均を生成し、量子化されたデータの必要性を排除するビルトインメソッドがありますか？

2016-12-10 arby

次のように（データを想定する範囲A2内である：B50）を適当な平均値を計算することができる。この式はTrapezoidal ruleを実装

=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2)

を各時間間隔に割り当てられた値は、観測値の平均でありますその間隔の終わりに。

ビルトインの「加重ヒストグラム」ツールがないため、代表的なヒストグラムを作成するには再サンプリングが必要です。再サンプリングの方法の1つがここにあります。たとえば、20個のサンプルが必要です。 C2で

=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19)

を入力して、均一に分布した時間値を20にします。（フェンスとポストの区別のために19で除算します）。次に、D2では、

=arrayformula(vlookup(C2:C21, A2:B50, 2))

が各サンプル時間の値を検索します。その後、列Dからヒストグラムを作成することができます。

2016-12-10 18:26:24 FTP

魅力的なように働いた！ありがとう！ – arby

答えて