變異量數

維基百科,自由的百科全書
前往: 導覽搜尋

變異量(數)Variance),應用數學裡的專有名詞。在機率論統計學中,一個隨機變數變異量數描述的是它的離散程度,也就是該變數離其期望值的距離。一個實隨機變數的變異量數也稱為它的二階矩或二階中心動差,恰巧也是它的二階累積量。變異量數的算術平方根稱為該隨機變數的標準差

定義[編輯]

設X為服從分布F的隨機變數, 如果E[X]是隨機變數X期望值(平均數μ=E[X]
隨機變數X或者分布F的變異量數為:

\operatorname{Var}(X) = \operatorname{E}\left[(X - \mu)^2 \right]

這個定義涵蓋了連續、離散、或兩者都有的隨機變數。變異量數亦可當作是隨機變數與自己本身的共變異數:

\operatorname{Var}(X) = \operatorname{Cov}(X, X)

變異量數典型的標記有Var(X), \scriptstyle\sigma_X^2, 或是\sigma^{2},其表示式可展開成為:

\operatorname{Var}(X)= \operatorname{E}\left[X^2 - 2X\operatorname{E}[X] + (\operatorname{E}[X])^2\right] = \operatorname{E}\left[X^2\right] - 2\operatorname{E}[X]\operatorname{E}[X] + (\operatorname{E}[X])^2 = \operatorname{E}\left[X^2 \right] - (\operatorname{E}[X])^2

上述的表示式可記為"平方的平均減掉平均的平方"

連續隨機變數[編輯]

如果隨機變數X是連續分布,並對應至機率密度函數f(x),則其變異量數為:

\operatorname{Var}(X) =\sigma^2 =\int (x-\mu)^2 \, f(x) \, dx\, =\int x^2 \, f(x) \, dx\, - \mu^2

此處\mu是一期望值,

\mu = \int x \, f(x) \, dx\,

且此處的積分為以X為範圍的x定積分(definite integral)
如果一個連續分佈不存在期望值,如柯西分佈(Cauchy distribution),也就不會有變異量數。

離散隨機變數[編輯]

如果隨機變數X是具有機率質量函數的離散機率分佈x1 ↦ p1, ..., xn ↦ pn,則:

\operatorname{Var}(X) = \sum_{i=1}^n p_i\cdot(x_i - \mu)^2 = \sum_{i=1}^n (p_i\cdot x_i^2) - \mu^2

此處\mu是其期望值, i.e.

\mu = \sum_{i=1}^n p_i\cdot x_i .

X為有N個相等機率值的平均分佈:

\operatorname{Var}(X) = \sigma^{2} =\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2 
= \frac{1}{N} \left(\sum_{i=1}^N x_i^2 - N\mu^2  \right)

N個相等機率值的變異量數亦可以點對點間的方變量表示為:

 \operatorname{Var}(X) = \frac{1}{N^2} \sum_{i=1}^N \sum_{j=1}^N \frac{1}{2}(x_i - x_j)^2

特性[編輯]

變異量數不會是負的,因為次方計算為正的或為零:

\operatorname{Var}(X)\ge 0

一個常數隨機變數的變異量數為零,且當一個資料集的變異量數為零時,其內所有項目皆為相同數值:

P(X=a) = 1\Leftrightarrow \operatorname{Var}(X)= 0

變異量數不變於定位參數的變動。也就是說,如果一個常數被加至一個數列中的所有變數值,此數列的變異量數不會改變:

\operatorname{Var}(X+a)=\operatorname{Var}(X)

如果所有數值被放大一個常數倍,變異量數會放大此常數的次方倍:

\operatorname{Var}(aX)=a^2\operatorname{Var}(X)

兩個隨機變數合的變異量數為:

\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\, \operatorname{Cov}(X,Y),
\operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)-2\, \operatorname{Cov}(X,Y),

此數Cov(., .)代表共變異數

對於N個隨機變數\{X_1,\dots,X_N\}的總和:

\operatorname{Var}\left(\sum_{i=1}^N X_i\right)=\sum_{i,j=1}^N\operatorname{Cov}(X_i,X_j)=\sum_{i=1}^N\operatorname{Var}(X_i)+\sum_{i\ne j}\operatorname{Cov}(X_i,X_j)

在樣本空間Ω上存在有限期望和變異量數的隨機變數構成一個希爾伯特空間: L2(Ω, dP),不過這裡的內積和長度跟變異量數,標準差還是不大一樣。 所以,我們得把這個空間「除」常變數構成的子空間,也就是說把相差一個常數的 所有原來那個空間的隨機變數做成一個等價類。這還是一個新的無窮維線性空間, 並且有一個從舊空間內積誘導出來的新內積,而這個內積就是變異量數

一般化[編輯]

如果X是一個向量其取值範圍在實數空間Rn,並且其每個元素都是一個一維隨機變數,我們就把X稱為隨機向量。隨機向量的變異量數是一維隨機變數變異量數的自然推廣,其定義為E[(X − μ)(X − μ)T],其中μ = E(X),XTX的轉置。這個變異量數是一個非負定方陣,通常稱為共變異數矩陣

如果X是一個複數隨機變數的向量(向量中每個元素均為複數的隨機變數),那麼其變異量數定義則為E[(X − μ)(X − μ)*],其中X*X共軛轉置向量或稱為埃爾米特向量。根據這個定義,變異數為實數。

歷史[編輯]

變異量數」(variance)這個名詞率先由羅納德·費雪英語Ronald Fisher)在論文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance[1]中提出。

參考出處[編輯]

相關條目[編輯]