威沙特分佈

**威沙特**
参数	自由度 (實數); 尺度矩陣 (正定)
值域	是正定的
概率密度函数
期望值
眾數
特徵函数

以統計學家约翰·威沙特為名的威沙特分佈是統計學上的一種半正定矩陣隨機分佈。^[1]這個分佈在多變量分析的协方差矩阵估計上相當重要。

定義[编辑]

假設X為一n × p矩陣，其各行（row）來自同一均值向量為 $\mathbf {0}$ 的 $p$ 維多變量常態分佈且彼此獨立。

X_{(i)}{=}(x_{i}^{1},\dots ,x_{i}^{p})^{T}\sim N_{p}(0,V),

則威沙特分佈為 $p\times p$ 散異矩陣（英语：Scatter matrix）

S=X^{T}X=\sum _{i=1}^{n}X_{(i)}X_{(i)}^{T},\,\!

的機率分佈。

$\mathbf {S}$ 有該機率分佈通常記為

\mathbf {S} \sim W_{p}(\mathbf {V} ,n).

其中正整數 $n$ 為自由度。有時亦記號為 $W(\mathbf {V} ,p,n)$ 。若 $p=1$ 且 $\mathbf {V} =1$ 則該分佈退化為一自由度為 $n$ 的單變量卡方分佈。

常見應用[编辑]

威沙特分佈常用於多變量的概似比檢定，亦用於隨機矩陣的頻譜理論中。

機率密度函數[编辑]

威沙特分佈具有下述的機率密度函數：

令' $\mathbf {W}$ 為一 $p\times p$ 正定對稱隨機變數矩陣。令 $\mathbf {V}$ 為一特定正定 $p\times p$ 矩陣。

如此，若 $n>p$ ，則 $\mathbf {W}$ 服從於一具自由度n的威沙特分佈且有機率度函數 $f_{W}$

f_{\mathbf {W} }(w)={\frac {\left|w\right|^{(n-p-1)/2}\exp \left[-{\rm {trace}}({\mathbf {V} }^{-1}w/2)\right]}{2^{np/2}\left|{\mathbf {V} }\right|^{n/2}\Gamma _{p}(n/2)}}

其中 $\Gamma _{p}(\cdot )$ 為多變量Gamma分佈，其定義為

\Gamma _{p}(n/2)=\pi ^{p(p-1)/4}\Pi _{j=1}^{p}\Gamma \left[(n+1-j)/2\right].

上述定義可推廣至任一實數 $n>p-1$ ^[2]

特徵函數[编辑]

威沙特分佈的特徵函數為

\Theta \mapsto \left|{\mathbf {I} }-2i\,{\mathbf {\Theta } }{\mathbf {V} }\right|^{-n/2}.

也就是說

\Theta \mapsto {\mathcal {E}}\left\{\mathrm {exp} \left[i\cdot \mathrm {trace} ({\mathbf {W} }{\mathbf {\Theta } })\right]\right\}=\left|{\mathbf {I} }-2i{\mathbf {\Theta } }{\mathbf {V} }\right|^{-n/2}

其中 ${\mathcal {E}}(\cdot )$ 為期望值

（這裡的 $\Theta$ 及 ${\mathbf {I} }$ 皆為與 ${\mathbf {V} }$ 維度相同的矩陣。（ ${\mathbf {I} }$ 為單位矩陣，而 $i$ 為－1的平方根）.^[3]

理論架構[编辑]

若 $\scriptstyle {\mathbf {W} }$ 為一自由度為m，共變異矩陣為 $\scriptstyle {\mathbf {V} }$ 的威沙特分佈，記為— $\scriptstyle {\mathbf {W} }\sim {\mathbf {W} }_{p}({\mathbf {V} },m)$ —其中 $\scriptstyle {\mathbf {C} }$ 為一 $q\times p$ 的q秩矩陣，則^[4]

{\mathbf {C} }{\mathbf {W} }{\mathbf {C} '}\sim {\mathbf {W} }_{q}\left({\mathbf {C} }{\mathbf {V} }{\mathbf {C} '},m\right).

推論1[编辑]

若 ${\mathbf {z} }$ 為一非負 $p\times 1$ 常數向量，則^[4] ${\mathbf {z} '}{\mathbf {W} }{\mathbf {z} }\sim \sigma _{z}^{2}\chi _{m}^{2}$ .

則在此情形下， $\chi _{m}^{2}$ 為一卡方分佈且 $\sigma _{z}^{2}={\mathbf {z} '}{\mathbf {V} }{\mathbf {z} }$ （因 ${\mathbf {V} }$ 為正定，所以 $\sigma _{z}^{2}$ 為一正常數）。

推論2[编辑]

在 ${\mathbf {z} '}=(0,\ldots ,0,1,0,\ldots ,0)$ 的情形下（亦即第j個元素為1其他為0），推論1可導出

w_{jj}\sim \sigma _{jj}\chi _{m}^{2}

為矩陣的每一個對對角元素的邊際分佈。

統計學家George Seber（英语：George Seber）曾論證威沙特分佈並非多變量卡方分佈，這是因為非對角元素的邊際分佈並非卡方分佈，Seber傾向於將某某多變量分佈此一遣詞用於所有元素的邊際分佈皆相同的情形。^[5]

多變量常態分佈的估計[编辑]

由於威沙特分佈可視為一多變量常態分佈其共變異矩陣的最大概似估計量（MLE）的分佈，其衍自MLE的計算可為令人驚喜地簡約而優雅。^[6] 基於頻譜理論，可將一純量視為一 $1\times 1$ 矩陣的跡（trace）。請參考共變異矩陣的估計。

分佈抽樣[编辑]

以下的演算法取材自 Smith & Hocking (1972)。^[7]一個來自自由度為n及共變異矩陣為 $\mathbf {V}$ 的威沙特分佈的 $p\times p$ （其中 $n\geq p$ ）隨機樣本可以如下方式抽樣而得：

生成一隨機 $p\times p$ $p\times p$ 下三角矩陣 ${\textbf {A}}$ ${\textbf {A}}$ 使得：
- $a_{ii}=(\chi _{n-i+1}^{2})^{1/2}$ ，意即 $a_{ii}$ 為一 $\chi _{n-i+1}^{2}$ 卡方分佈隨機樣本的平方根。
- $a_{ij}$ 其中 $j<i$ ，為一 $N_{1}(0,1)$ 常態分佈的隨機樣本。^[8]
計算 ${\textbf {V}}={\textbf {L}}{\textbf {L}}^{T}$ 的Cholesky分解。
計算 ${\textbf {X}}={\textbf {L}}{\textbf {A}}{\textbf {A}}^{T}{\textbf {L}}^{T}$ 。此時， ${\textbf {X}}$ 為一 $W_{p}({\textbf {V}},n)$ 的隨機樣本。