偏度

维基百科,自由的百科全书
跳转至: 导航搜索
偏度不為零的實驗數據樣本(小麥胚芽鞘向地反應:1,790)

機率論統計學中,偏度衡量實數隨機變量概率分布的不對稱性。偏度的值可以為正,可以為負或者甚至是無法定義。在數量上,偏度為負(負偏態)就意味着在概率密度函數左側的尾部比右側的長,絕大多數的值(包括中位數在內)位於平均值的右側。偏度為正(正偏態)就意味着在概率密度函數右側的尾部比左側的長,絕大多數的值(包括中位數在內)位於平均值的左側。偏度為零就表示數值相對均勻地分布在平均值的兩側,但不一定意味着其為對稱分布。

負偏態(左)和正偏態(右)

介紹[编辑]

偏度分為兩種:

  • 負偏態左偏態:左側的尾部更長,分布的主體集中在右側。[1]
  • 正偏態右偏態:右側的尾部更長,分布的主體集中在左側。[1]

如果分布對稱,那麼平均值=中位數,偏度為零(此外,如果分布為單峰分布,那麽平均值=中位數=眾數)。

定義[编辑]

隨機變量X的偏度γ1為三階標準矩,可被定義為:


    \gamma_1 = \operatorname{E}\Big[\big(\tfrac{X-\mu}{\sigma}\big)^{\!3}\, \Big] 
             = \frac{\mu_3}{\sigma^3} 
             = \frac{\operatorname{E}\big[(X-\mu)^3\big]}{\ \ \ ( \operatorname{E}\big[ (X-\mu)^2 \big] )^{3/2}}
             = \frac{\kappa_3}{\kappa_2^{3/2}}\ ,

其中μ3是三階中心矩,σ是標準差E期望算子。等式的最後以三階累積量與二階累積量的1.5次方的比率來表示偏度。這和用四階累積量除去二階累積量的平方來表示峰度的方法向類似。

偏度有時用Skew[X]來表示。老教科書過去常常用\scriptstyle\sqrt{\beta_1},來表示偏度,可是由於偏度可為負,這樣的表示法較為不便。

對上面的等式進行擴展可導出用非中心矩E[X3]來表示偏度的公式:


    \gamma_1 
     = \operatorname{E}\bigg[\Big(\frac{X-\mu}{\sigma}\Big)^{\!3} \,\bigg] 
     = \frac{\operatorname{E}[X^3] - 3\mu\operatorname E[X^2] + 2 \mu^3}{\sigma^3}
     = \frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}\ .

樣本偏度[编辑]

具有n個值的樣本樣本偏度為:


    g_1 = \frac{m_3}{{m_2}^{3/2}} 
        = \frac{\tfrac{1}{n} \sum_{i=1}^n (x_i-\overline{x})^3}{\left(\tfrac{1}{n} \sum_{i=1}^n (x_i-\overline{x})^2\right)^{3/2}}\ ,

其中\overline{x}樣本平均值m3是三階樣本中心矩,m2是二階樣本中心距,即樣本方差

性質[编辑]

當: \Pr \left[ X > x \right]=x^{-3}\mbox{ for }x>1,\ \Pr[X<1]=0 時,偏度可以是無窮大的。

或者當: \Pr[X<x]=(1-x)^{-3}/2(x為負)及

\Pr[X>x]=(1+x)^{-3}/2(x為正)時,偏度無法定義。

在後面的這個例子中,三階累積量是無法定義的。 其他分布形式比如:

\Pr \left[ X > x \right]=x^{-2}\mbox{ for }x>1,\ \Pr[X<1]=0

二階和三階累積量是無窮大的,所以偏度也是無法定義的。

如果假定Yn個獨立變量之和並且這些變量和X具有相同的分布,那麽Y的三階累積量是Xn倍,Y的二階累積量也是Xn倍,所以: \mbox{Skew}[Y] = \mbox{Skew}[X]/\sqrt{n}。根據中心極限定理,當其接近高斯分布時變量之和的偏度減小。

參見[编辑]

註釋[编辑]

參考資料[编辑]

  • Groeneveld, RA; Meeden, G. Measuring Skewness and Kurtosis. The Statistician. 1984, 33 (4): 391–399. doi:10.2307/2987742. 
  • Johnson, NL, Kotz, S, Balakrishnan N (1994) Continuous Univariate Distributions, Vol 1, 2nd Edition Wiley ISBN0-471-58495-9
  • MacGillivray, HL. Shape properties of the g- and h- and Johnson families. Comm. Statistics - Theory and Methods. 1992, 21: 1244–1250.