协方差矩阵
在统计学与概率论中,共變異數矩阵是一个矩阵,其每个元素是各个向量元素之间的共變異數。这是从标量随机变量到高维度随机向量的自然推广。
假设
是以
个标量随机变量组成的列向量,
并且
是其第i个元素的期望值,即,
。共變異數矩阵被定义的第i,j項是如下:
即:
矩阵中的第
个元素是
与
的共變異數。这个概念是对于标量随机变量方差的一般化推广。
目录 |
术语与符号分歧 [编辑]
共變異數矩阵有不同的术语。有些统计学家,沿用了概率学家威廉·费勒的说法,把这个矩阵称之为随机向量
的變異數(Variance of random vector X),这是从一维随机变量方差到高维随机向量的自然推广。另外一些则把它称为共變異數矩阵(Covariance matrix),因为它是随机向量里头每个标量元素的协方差的矩阵。不幸的是,这两种术语带来了一定程度上的冲突:
随机向量
的方差(Variance of random vector X)定义有如下两种形式:
协方差矩阵(Covariance matrix)定义如下:
第一个记号可以在威廉·费勒的广受推崇的两册概率论及其应用的书中找到。两个术语除了记法之外并没有不同。
性质 [编辑]
与
满足下边的基本性质:






- 若
,則有

- 若
与
是独立的,則有

其中
与
是随机
向量,
是随机
向量,
是
向量,
与
是
矩阵。
尽管共變異數矩阵很简单,可它却是很多领域里的非常有力的工具。它能导出一个变换矩阵,这个矩阵能使数据完全去相关(decorrelation)。从不同的角度看,也就是说能够找出一组最佳的基以紧凑的方式来表达数据。(完整的证明请参考瑞利商)。 这个方法在统计学中被称为主成分分析(principal components analysis),在图像处理中称为Karhunen-Loève 变换(KL-变换)。
複随机向量 [编辑]
均值为
的複随机标量变量的方差定义如下(使用共轭複数):
其中复数
的共轭记为
。
如果
是一个复列向量,则取其共轭转置,得到一个方阵:
其中
为共轭转置, 它对于标量也成立,因为标量的转置还是标量。
估计 [编辑]
多元正态分布的共變異數矩阵的估计的推导非常精致. 它需要用到谱定义以及为什么把标量看做
矩阵的trace更好的原因。参见共變異數矩阵的估计。
外部连接 [编辑]
- Covariance Matrix at Mathworld


![=
\begin{bmatrix}
\mathrm{E}[(X_1 - \mu_1)(X_1 - \mu_1)] & \mathrm{E}[(X_1 - \mu_1)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_1 - \mu_1)(X_n - \mu_n)] \\ \\
\mathrm{E}[(X_2 - \mu_2)(X_1 - \mu_1)] & \mathrm{E}[(X_2 - \mu_2)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_2 - \mu_2)(X_n - \mu_n)] \\ \\
\vdots & \vdots & \ddots & \vdots \\ \\
\mathrm{E}[(X_n - \mu_n)(X_1 - \mu_1)] & \mathrm{E}[(X_n - \mu_n)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_n - \mu_n)(X_n - \mu_n)]
\end{bmatrix}](http://upload.wikimedia.org/math/a/1/2/a12a573ecd1d853abd8c01fab9fccfbe.png)
![\operatorname{var}(\textbf{X})
=
\mathrm{E}
\left[
(\textbf{X} - \mathrm{E} [\textbf{X}])
(\textbf{X} - \mathrm{E} [\textbf{X}])^\top
\right]](http://upload.wikimedia.org/math/a/a/6/aa6ffc282ba29d00c335a23382b40987.png)
![\operatorname{cov}(\textbf{X})
=
\mathrm{E}
\left[
(\textbf{X} - \mathrm{E}[\textbf{X}])
(\textbf{X} - \mathrm{E}[\textbf{X}])^\top
\right]](http://upload.wikimedia.org/math/7/e/d/7ed65371a44725879fa952b960a30ac1.png)
![\operatorname{cov}(\textbf{X},\textbf{Y})
=
\mathrm{E}
\left[
(\textbf{X} - \mathrm{E}[\textbf{X}])
(\textbf{Y} - \mathrm{E}[\textbf{Y}])^\top
\right]](http://upload.wikimedia.org/math/a/f/6/af6bc9efa5c14e9711fd70e417325dfc.png)






,則有

与

![\operatorname{var}(z)
=
\operatorname{E}
\left[
(z-\mu)(z-\mu)^{*}
\right]](http://upload.wikimedia.org/math/a/e/d/aedf356d1e06c9057edbee3a8609c55c.png)
![\operatorname{E}
\left[
(Z-\mu)(Z-\mu)^{*}
\right]](http://upload.wikimedia.org/math/0/b/2/0b2ef4709a2d9d1fc1e429f32dc98275.png)