2013-07-22 21 views
5

私は、ヒストグラムとしてプロットされたときにガウス形のデータを持っています。ヒストグラムの上にガウス曲線をプロットして、データの良さを確認したいと思います。私はmatplotlibからpyplotを使用しています。また、私はヒストグラムを正規化したくありません。私は標準的なフィットを行うことができますが、私はUn-normalizedフィットを求めています。誰でもここでそれを行う方法を知っていますか?ヒストグラムの正規化されていないガウス曲線

ありがとうございます!一例として、 アブヒナフ・クマール

+0

この例は役に立ちますか? http://matplotlib.org/examples/api/histogram_demo.html – DMH

+0

いいえ、その基本的に私が望んでいないものです。私は正規化したくない。 –

答えて

6

import pylab as py 
import numpy as np 
from scipy import optimize 

# Generate a 
y = np.random.standard_normal(10000) 
data = py.hist(y, bins = 100) 

# Equation for Gaussian 
def f(x, a, b, c): 
    return a * py.exp(-(x - b)**2.0/(2 * c**2)) 

# Generate data from bins as a set of points 
x = [0.5 * (data[1][i] + data[1][i+1]) for i in xrange(len(data[1])-1)] 
y = data[0] 

popt, pcov = optimize.curve_fit(f, x, y) 

x_fit = py.linspace(x[0], x[-1], 100) 
y_fit = f(x_fit, *popt) 

plot(x_fit, y_fit, lw=4, color="r") 

enter image description here

これは、あなたがフィット感がどのように良いのための定量的数値を与えることpcovを使用する必要があり、分布にガウスプロットをフィットします。

データがガウス分布であるかどうかを判断する良い方法は、Pearson chi-squared testです。理解するのは練習が必要ですが、非常に強力なツールです。

+0

上記のあなたのフィットについてa、b、cを検索できますか?私はそれが期待されるものと確認したい。 –

+0

これは正確に 'popt'です。 'f(x_fit、* popt)'を実行した 'y_fit'を得ることに気付くでしょう。これは' popt'のタプルを 'f'の引数に展開するトリックです。詳しくは、ドキュメントを参照してください。 – Greg

3

これを行うための別の方法は、正規化されたフィットを見つけると(データのbin_width *合計の長さ)の正規分布を乗算することである

これはあなたの正規分布

4

私が知っている古いポストを非正規化されますしかし、これを行うために私のコードを寄稿したいと思っていました。

from scipy.stats import norm 
from numpy import linspace 
from pylab import plot,show,hist 

def PlotHistNorm(data, log=False): 
    # distribution fitting 
    param = norm.fit(data) 
    mean = param[0] 
    sd = param[1] 

    #Set large limits 
    xlims = [-6*sd+mean, 6*sd+mean] 

    #Plot histogram 
    histdata = hist(data,bins=12,alpha=.3,log=log) 

    #Generate X points 
    x = linspace(xlims[0],xlims[1],500) 

    #Get Y points via Normal PDF with fitted parameters 
    pdf_fitted = norm.pdf(x,loc=mean,scale=sd) 

    #Get histogram data, in this case bin edges 
    xh = [0.5 * (histdata[1][r] + histdata[1][r+1]) for r in xrange(len(histdata[1])-1)] 

    #Get bin width from this 
    binwidth = (max(xh) - min(xh))/len(histdata[1])   

    #Scale the fitted PDF by area of the histogram 
    pdf_fitted = pdf_fitted * (len(data) * binwidth) 

    #Plot PDF 
    plot(x,pdf_fitted,'r-') 
関連する問題