威沙特分佈

维基百科,自由的百科全书
跳转至: 导航搜索
威沙特
參數  n > 0\! 自由度 (實數)
\mathbf{V} > 0\, 尺度矩陣 (正定)
支撑集 \mathbf{W}\!是正定的
概率密度函數 \frac{\left|\mathbf{W}\right|^\frac{n-p-1}{2}}
                         {2^\frac{np}{2}\left|{\mathbf V}\right|^\frac{n}{2}\Gamma_p(\frac{n}{2})} \exp\left(-\frac{1}{2}{\rm Tr}({\mathbf V}^{-1}\mathbf{W})\right)
期望值 n \mathbf{V}
眾數 (n-p-1)\mathbf{V}\text{ for }n \geq p+1
特性函数 \Theta \mapsto \left|{\mathbf I} - 2i\,{\mathbf\Theta}{\mathbf V}\right|^{-n/2}

統計學家约翰·威沙特為名的威沙特分佈統計學上的一種半正定矩陣隨機分佈。這個分佈在多變量分析共變異矩陣估計上相當重要。

定義[编辑]

假設X為一n × p矩陣,其各行(row)來自同一均值向量為\mathbf 0p多變量常態分佈且彼此獨立

X_{(i)}{=}(x_i^1,\dots,x_i^p)^T\sim N_p(0,V),

則威沙特分佈為p\times p散異矩陣

S=X^T X = \sum_{i = 1}^{n} X_{(i)} X_{(i)}^T, \,\!

機率分佈

\mathbf S有該機率分佈通常記為

\mathbf S\sim W_p(\mathbf V,n).

其中正整數n自由度。有時亦記號為W(\mathbf V, p, n)。若 p = 1\mathbf V=1則該分佈退化為一自由度為n的單變量卡方分佈

常見應用[编辑]

威沙特分佈常用於多變量的概似比檢定,亦用於隨機矩陣的頻譜理論中。

機率密度函數[编辑]

威沙特分佈具有下述的機率密度函數

令'\mathbf W為一p\times p正定對稱隨機變數矩陣。令\mathbf V為一特定正定p\times p矩陣。

如此,若n > p,則\mathbf W服從於一具自由度n的威沙特分佈且有機率度函數f_W


f_{\mathbf W}(w)=
\frac{
  \left|w\right|^{(n-p-1)/2}
  \exp\left[ - {\rm trace}({\mathbf V}^{-1}w/2 )\right] 
}{
2^{np/2}\left|{\mathbf V}\right|^{n/2}\Gamma_p(n/2)
}

其中\Gamma_p(\cdot)多變量Gamma分佈,其定義為


\Gamma_p(n/2)=
\pi^{p(p-1)/4}\Pi_{j=1}^p
\Gamma\left[ (n+1-j)/2\right].

上述定義可推廣至任一實數n> p -1

特徵函數[编辑]

威沙特分佈的特徵函數


\Theta \mapsto \left|{\mathbf I} - 2i\,{\mathbf\Theta}{\mathbf V}\right|^{-n/2}.

也就是說

\Theta \mapsto {\mathcal E}\left\{\mathrm{exp}\left[i\cdot\mathrm{trace}({\mathbf W}{\mathbf\Theta})\right]\right\}
=
\left|{\mathbf I} - 2i{\mathbf\Theta}{\mathbf V}\right|^{-n/2}

其中{\mathcal E}(\cdot)為期望值

(這裡的\Theta{\mathbf I} 皆為與{\mathbf V}維度相同的矩陣。({\mathbf I}單位矩陣,而i為-1的平方根).

理論架構[编辑]

\scriptstyle {\mathbf W}為一自由度為m,共變異矩陣為\scriptstyle {\mathbf V}的威沙特分佈,記為—\scriptstyle {\mathbf W}\sim{\mathbf W}_p({\mathbf V},m)—其中\scriptstyle{\mathbf C}為一q\times pq秩矩陣,則


{\mathbf C}{\mathbf W}{\mathbf C'}
\sim
{\mathbf W}_q\left({\mathbf C}{\mathbf V}{\mathbf C'},m\right).

推論1[编辑]

{\mathbf z}為一非負p\times 1常數向量,則 {\mathbf z'}{\mathbf W}{\mathbf z}\sim\sigma_z^2\chi_m^2.

則在此情形下,\chi_m^2為一卡方分佈\sigma_z^2={\mathbf z'}{\mathbf V}{\mathbf z}(因{\mathbf V}為正定,所以\sigma_z^2為一正常數)。

推論2[编辑]

{\mathbf z'}=(0,\ldots,0,1,0,\ldots,0) 的情形下(亦即第j個元素為1其他為0),推論1可導出

w_{jj}\sim\sigma_{jj}\chi^2_m

為矩陣的每一個對對角元素的邊際分佈。

統計學家George Seber曾論證威沙特分佈並非多變量卡方分佈,這是因為非對角元素的邊際分佈並非卡方分佈,Seber傾向於將某某多變量分佈此一遣詞用於所有元素的邊際分佈皆相同的情形。

多變量常態分佈的估計[编辑]

由於威沙特分佈可視為一多變量常態分佈其共變異矩陣最大概似估計量(MLE)的的分佈,其衍自MLE的計算可為令人驚喜地簡約而優雅。 基於頻譜理論,可將一純量視為一1\times 1矩陣的跡(trace)。請參考共變異矩陣的估計

分佈抽樣[编辑]

以下的演算法取材自 Smith & Hocking [1]。一個來自自由度為n及共變異矩陣為\mathbf V的威沙特分佈的p\times p(其中n \geq p)隨機樣本可以如下方式抽樣而得:

  1. 生成一隨機p\times p三角矩陣 {\textbf A}使得:
    • a_{ii}=(\chi^2_{n-i+1})^{1/2},意即 a_{ii}為一\chi^2_{n-i+1}卡方分佈隨機樣本的平方根。
    • a_{ij}其中j<i,為一N_1(0,1)常態分佈的隨機樣本。
  2. 計算{\textbf V} = {\textbf L}{\textbf L}^TCholesky分解
  3. 計算{\textbf X} = {\textbf L}{\textbf A}{\textbf A}^T{\textbf L}^T。此時,{\textbf X} 為一W_p({\textbf V},n)的隨機樣本。

{\textbf V}={\textbf I},則因{\textbf V}={\textbf I}{\textbf I}^T,可以直接以{\textbf X} = {\textbf A}{\textbf A}^T進行抽樣。

參考條目[编辑]

參考資料[编辑]