0
私は異なるデータセットの最初の桁の分布を比較しようとしていますが、ggplot2を使ってそれらを実証する方法はありません。誰もが "生データ"の例を使用し、確率は使用しません。上記ggplot2確率分布を比較するためのヒストグラムまたはポリゴン
0.37101911 0.17515924 0.08917197 0.08121019 0.06210191 0.06050955 0.07484076 0.03662420 0.04936306
0.524419536 0.253002402 0.092073659 0.032826261 0.025620496 0.019215372 0.008807046 0.012009608 0.032025620
確率:これは、2つのデータセットの最初の桁の分布である
0.30103000 0.17609126 0.12493874 0.09691001 0.07918125 0.06694679 0.05799195 0.05115252 0.04575749
:
これは、所望の第1の桁の分布(私のベンチマーク)である:ここで私のデータの一部であります最初の数字1,2、...、9の確率に対応します。
上記の確率を見つけるために使用するパッケージの発行者が作成したプロットがあります。
1st Dataset first-digit Distribution (the red line is my "benchmark")
。ありがとうございます:D –