峰度 (英語:Kurtosis ),亦稱尖度 ,在統計學 中衡量實數 隨機變量 概率分布 的峰態。峰度高就意味著方差 增大是由低頻度的大於或小於平均值 的極端差值引起的。
遠紅光對
小麥 胚芽鞘 向地反應 的平均速度沒有影響,但是峰度由低峰態轉變成了尖峰態 (−0.194 → 0.055)
母體 峰態係數定義為:
μ
4
σ
4
,
{\displaystyle {\frac {\mu _{4}}{\sigma ^{4}}},\!}
即四階標準矩 ,其中μ4 是四階主動差 ,σ是標準差 。
在更通常的情況下,峰度被定義為四階累積量 除以二階累積量的平方,它等於四階中心矩除以概率分布 方差的平方再減去3:
γ
2
=
κ
4
κ
2
2
=
μ
4
σ
4
−
3
{\displaystyle \gamma _{2}={\frac {\kappa _{4}}{\kappa _{2}^{2}}}={\frac {\mu _{4}}{\sigma ^{4}}}-3}
這也被稱為超值峰度(excess kurtosis)。「減3」是為了讓正態分布 的峰度為0。
假定Y 為n 個獨立變量之和,且這些變量和X 具有相同的分布,那麽:Kurt[Y ] = Kurt[X ] / n ,
但如果峰度被定義為:μ4 / σ4 ,公式可變得更加複雜。
更一般地說,假定X 1 , ..., X n 為方差相等的獨立隨機變量,那麼:
Kurt
(
∑
i
=
1
n
X
i
)
=
1
n
2
∑
i
=
1
n
Kurt
(
X
i
)
,
{\displaystyle \operatorname {Kurt} \left(\sum _{i=1}^{n}X_{i}\right)={1 \over n^{2}}\sum _{i=1}^{n}\operatorname {Kurt} (X_{i}),}
而定義中如果不包含「減3」就無法成立。
如果超值峰度為正,稱為高狹峰 (leptokurtic)。如果超值峰度為負,稱為低闊峰 (platykurtic)。
樣本峰度 [ 编辑 ]
對於具有n 個值的樣本 ,樣本峰度 為:
g
2
=
m
4
m
2
2
−
3
=
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
4
(
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
2
)
2
−
3
{\displaystyle g_{2}={\frac {m_{4}}{m_{2}^{2}}}-3={\frac {{\tfrac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{4}}{\left({\tfrac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\right)^{2}}}-3}
其中m 4 是四階樣本中心矩,m 2 是二階中心矩(即使樣本方差 ),x i 是第i th 個值,
x
¯
{\displaystyle {\overline {x}}}
是樣本平均值 。注意此处计算方差的时候除数是N,而不是单独计算样本方差的(N-1)。
有時候也使用公式:
D
=
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
2
{\displaystyle D={1 \over n}\sum _{i=1}^{n}{(x_{i}-{\bar {x}})^{2}}}
,
E
=
1
n
D
2
∑
i
=
1
n
(
x
i
−
x
¯
)
4
−
3
{\displaystyle E={1 \over nD^{2}}\sum _{i=1}^{n}{(x_{i}-{\bar {x}})^{4}}-3}
其中,n為樣本大小,D 為事先計算的方差,xi 為第i個測量值,
x
¯
{\displaystyle {\bar {x}}}
為事先計算的算術平均數 。
在一些统计软件中,其公式有所差别。如EXCEL,计算样本的峰度公式如下:
Kurtosis
=
n
(
n
+
1
)
(
n
−
1
)
(
n
−
2
)
(
n
−
3
)
∑
i
=
1
n
(
x
i
−
x
¯
StDev
)
4
−
3
(
n
−
1
)
2
(
n
−
2
)
(
n
−
3
)
{\displaystyle {\text{Kurtosis}}={n(n+1) \over (n-1)(n-2)(n-3)}\sum _{i=1}^{n}({x_{i}-{\bar {x}} \over {\text{StDev}}})^{4}-{3(n-1)^{2} \over (n-2)(n-3)}}
參考資料 [ 编辑 ]