峰度

維基百科,自由的百科全書
跳到: 導覽搜尋

統計學中,峰度(Kurtosis)衡量實數隨機變量機率分佈的峰態。峰度高就意味着方差增大是由低頻度的大於或小於平均值的極端差值引起的。

遠紅光對小麥胚芽鞘向地反應的平均速度沒有影響,但是峰度由低峰態轉變成了尖峰態 (−0.194 → 0.055)

定義[編輯]

四階標準矩可以定義為:

\frac{\mu_4}{\sigma^4},\!

其中μ4是四階中心矩,σ是標準差

在更通常的情況下,峰度被定義為四階累積量除以二階累積量的平方,它等於四階中心矩除以機率分佈方差的平方再減去3:

\gamma_2 = \frac{\kappa_4}{\kappa_2^2} = \frac{\mu_4}{\sigma^4} - 3

這也被稱為超值峰度(excess kurtosis)。「減3」是為了讓正態分佈的峰度為0。

假定Yn個獨立變量之和,且這些變量和X具有相同的分佈,那麼:Kurt[Y] = Kurt[X] / n, 但如果峰度被定義為:μ4 / σ4,公式可變得更加複雜。

更一般地說,假定X1, ..., Xn 為方差相等的獨立隨機變量,那麼:

\operatorname{Kurt}\left(\sum_{i=1}^n X_i \right) = {1 \over n^2} \sum_{i=1}^n \operatorname{Kurt}(X_i),

而定義中如果不包含「減3」就無法成立。

如果超值峰度為正,稱為尖峰態(leptokurtic)。如果超值峰度為負,稱為低峰態(platykurtic)。


樣本峰度[編輯]

對於具有n個值的樣本樣本峰度為:

 g_2 = \frac{m_4}{m_{2}^2} -3 = \frac{\tfrac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^4}{\left(\tfrac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3

其中m4是四階樣本中心矩,m2是二階中心矩(即使樣本方差),xi是第ith個值,\overline{x}樣本平均值

有時候也使用公式:

 D = {1 \over n} \sum_{i=1}^n{ (x_i - \bar{x})^2} ,
 E = {1 \over n D^2} \sum_{i=1}^n{ (x_i - \bar{x})^4} - 3

其中,n為樣本大小,D為事先計算的方差,xi為第i個測量值,\bar{x}為事先計算的算術平均數

在一些統計軟件中,其公式有所差別。如EXCEL,計算樣本的峰度公式如下:

 \text{Kurtosis} = {n(n+1) \over (n-1)(n-2)(n-3)}\sum_{i=1}^n({x_i-\bar{x} \over \text{StDev}})^4 - {3(n-1) ^2\over (n-2)(n-3)}

參見[編輯]

參考資料[編輯]