2016-07-28 3 views
1

上のYの確率を返します」収入に少なくとも€bの確率があります」。普通の古い定規を使用しても、少なくとも6,000ユーロの確率で〜83%の確率があることがわかりますが、与えられた€bに対してセル内で正確な数値を動的に得ることはできないようです。は、私は私のGoogleスプレッドシートドキュメントにここに示すように、CDF曲線を持つCDF曲線

私が今までに遭遇した解決策に最も近いのは、現在のCDF曲線を正規分布として模倣すると考えた次のものを使用することです。

= 1-NORMDIST(6000、AVERAGE(F6:F31)、STDEV(F6:F31)、TRUE)

しかし、これは私がチャートから読み取ることができるよりも戻りはるかに低い数字に思える(0.664507462であります上記の関数のために返される)ので、normdistはおそらくCDFカーブを正確に記述しません。

ExcelのプラグインやMATLABを使用して解決策を見つけましたが、Googleスプレッドシートを使用しているため、どちらも該当しません。

適切な解決策を知っている人は誰ですか?前もって感謝します!

+0

ありがとうございます! [Excel]を削除しました。 Cross Validatedは助けになるかもしれませんが(明日そこに投稿します)、Googleシート固有の解決策が必要です。前述のように、問題がExcelまたはMATLABの場合は解決策がありました。 –

+1

Excelソリューションはプラグインに含まれていますが、そのソースコードにアクセスできません。それ以外の場合は、JSに書き直してGASコードとして追加することができます。残念ながら、あなたが推測したように、それはどちらも選択肢ではありません。 –

+0

2つの質問:CDFは累積分布関数に基づいているか、それとも測定値に基づいていますか?これらの数字をすべてコピーしないようにサンプルスプレッドシートを共有できますか? –

答えて

1

CDFは比較的スムーズな関数なので、線形補間を使用して、既知のパーセンテージをブラケットに基づいて特定の収益値に対して未知のパーセンテージを近似することができます。あなたの6000例:

6000 - 5701.57 p - 85 
----------------- = ------- => p = 82.7416 (approximately) 
6890.85 - 5701.57 76 - 85 

線形補間は、あなたのニーズに十分に正確でない場合は、より高次の多項式補間を試みることができます。

2

問題は、バケットサイズで重み付けしていないオーバービューで予測を実行していることです。
以下のプロットはこの問題を示しています。正規分布(赤色)がデータ(黒色)より確率が低い$ 6000です。 Wrong CDF

あなたはこの

=SUMPRODUCT(D6:D31, F6:F31)/SUM(D6:D31) 

そして、F36は上記の平均値を計算され、この

=SQRT(SUMPRODUCT((F6:F31 - F36)^2, D6:D31)/(SUM(D6:D31) - 1)) 

のような全体的な標準偏差のような全体的な平均値を計算することができます。

概観の平均および標準偏差の代わりに2つのパラメータを式に接続すると、実際に測定された累積分布に非常に近い79%の推定値(緑色の線)が得られます。

Fixed CDF

関連する問題