正定矩阵

维基百科,自由的百科全书
跳转至: 导航搜索
线性代数
\mathbf{A} = \begin{bmatrix}
1 & 2 \\
3 & 4 \end{bmatrix}
向量 · 矩阵  · 行列式  · 线性空间

线性代数裡,正定矩阵埃尔米特矩阵的一种,有时会简称为正定阵。在双线性代数中,正定矩阵的性质類似复数中的实数。与正定矩阵相对应的线性算子对称正定双线性形式(複域中则对应埃尔米特正定双线性形式)。

定义[编辑]

一个n×n的实对称矩阵M正定的,当且仅当对于所有的非零实系数向量z,都有zTMz > 0。其中zT表示z转置

对于复数的情况,定义则为:一个n×n埃尔米特矩阵(或厄米矩阵)M是正定的当且仅当对于每个非零的複向量z,都有z*Mz > 0。其中z*表示z共轭转置。由于M埃尔米特矩阵,经计算可知,对于任意的複向量zz*Mz必然是实数,从而可以与0比较大小。因此这个定义是自洽的。

正定阵的判别[编辑]

n×n埃尔米特矩阵M,下列性质与“M为正定矩阵”等价:

1. 矩阵M的所有的特征值\lambda_i都是正的。根据谱定理M必然与一个实对角矩阵D相似(也就是说M = P^{-1}DP ,其中P幺正矩阵,或者说M在某
正交基可以表示为一个实对角矩阵)。因此,M是正定阵当且仅当相应的D的对角线上元素都是正的。
2. 半双线性形式
\langle \textbf{x},\textbf{y}\rangle = \textbf{x}^{*} M \textbf{y}

定义了一个Cn上的内积。实际上,所有Cn上的内积都可看做由某个正定阵通过此种方式得到。

3. Mn个线性无关的k维向量\textbf{x}_1,\ldots,\textbf{x}_n \in \mathbb{C}^kGram矩阵,其中的k为某个正整数。更精确地说,M定义为:
M_{ij} = \langle \textbf{x}_i, \textbf{x}_j\rangle = \textbf{x}_i^{*} \textbf{x}_j.

换句话说,M具有A^*A的形式,其中A不一定是方阵,但需要是单射的。

4. M的所有顺序主子式,也就是顺序主子阵行列式都是正的(西尔维斯特准则)。明确来说,就是考察下列矩阵的行列式:
  • M左上角1×1的矩阵
  • M左上角2×2矩阵
  • ...
  • M自身。

对于半正定矩阵来说,相应的条件应改为所有的主子式非负。顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:

 \begin{bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 0 \end{bmatrix}
5. 存在唯一的下三角矩阵L,其主对角线上的元素全是正的,使得:
M=L L^*.

其中L^*L共轭转置。 T这一分解被称为Cholesky分解

对于实对称矩阵,只需将上述性质中的\mathbb{C}^n改为\mathbb{R}^n,将“共轭转置”改为“转置”就可以了。

二次型[编辑]

由以上的第二个等价条件,可以得到二次型形式下正定矩阵的等价条件:用\mathbb{K}代表\mathbb{C}\mathbb{R},设\mathbb{V}\mathbb{K}上的一个向量空间。一个埃尔米特型

B : V \times V \rightarrow K

是一个双线性映射,使得Bx, y)总是By, x)的共轭。这样的一个映射B正定的当且仅当对\mathbb{V}中所有的非零向量x,都有B(x, x) > 0。

负定、半定及不定矩阵[编辑]

与正定矩阵相对应的,一个n×n的埃尔米特矩阵M负定矩阵当且仅当对所有不为零的x \in \mathbb{R}^n(或x \in \mathbb{C}^n),都有:

x^{*} M x < 0\,

M半正定矩阵当且仅当对所有不为零的x \in \mathbb{R}^n(或x \in \mathbb{C}^n),都有:

x^{*} M x \geq 0

M半负定矩阵当且仅当对所有不为零的x \in \mathbb{R}^n(或x \in \mathbb{C}^n),都有:

x^{*} M x \leq 0

可以看出,上一节中正定阵的等价性质1只需略作相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当M是半正定时,相应的Gram矩阵不必由线性无关的向量组成。对任意矩阵AA*A必然是半正定的,并有rank(A) = rank(A*A,两者的相等)。反过来,任意的半正定矩阵都可以写作M = A*A,这就是Cholesky分解

一个埃尔米特矩阵M是负定矩阵当且仅当M的所有奇数阶顺序主子式小于0,所有偶数阶顺序主子式大于0。当M是负定矩阵时,M的逆矩阵也是负定的。

如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵

相关性质[编辑]

 M 为半正定阵,可以写作 M \geq 0 。如果 M 是正定阵,可以写作 M > 0 。这个记法来自泛函分析,其中的正定阵定义了正算子

对于一般的埃尔米特矩阵,MN M\geq N 当且仅当 M-N \geq 0 。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义M>N

1. 每个正定阵都是可逆的,它的逆也是正定阵。如果 M \geq N > 0 那么 N^{-1} \geq M^{-1} > 0
2. 如果M是正定阵,r > 0为正实数,那么r M也是正定阵。

如果MN是正定阵,那么和M + N、乘积MNMNMN都是正定的。如果M N = N M,那么M N仍是正定阵。

3. 如果 M=(m_{ij}) > 0 那么主对角线上的系数 m_{ii} 为正实数。于是有 \text{tr}(M)>0 。此外还有
  | m_{ij} | \leq \sqrt{m_{ii} m_{jj}} \leq \frac{m_{ii}+m_{jj}}{2}.
4. 矩阵 M 是正定阵当且仅当存在唯一的正定阵 B>0 使得 B^2 = M 。根据其唯一性可以记作 B = M^{1/2} ,称 B M 的平方根。对半正定阵也有类似结论。同时,如果 M > N > 0 那么 M^{1/2} > N^{1/2}>0 .
5. 如果 M,N > 0 那么 M\otimes N > 0 ,其中\otimes表示克罗内克乘积
6. 对矩阵 M=(m_{ij}),N=(n_{ij}) ,将两者同一位置上的系数相乘所得的矩阵记为 M\circ N ,即M\circ N_{i,j}=m_{ij} n_{ij} ,称为 M  N 阿达马乘积。如果 M,N>0 ,那么 M\circ N > 0 。如果 M,N 实系数矩阵,则有如下不等式成立:

 \det(M\circ N) \geq (\det N) \prod_{i} m_{ii}.

7.  M > 0  N 为埃尔米特矩阵。如果 MN+NM \geq 0  MN+NM > 0 ),那么 N\geq 0  N > 0)。
8. 如果 M,N\geq 0为实系数矩阵,则 \text{tr}(MN)\geq 0
9. 如果 M>0为实系数矩阵,那么存在 \delta>0 使得 M\geq \delta I,其中 I 单位矩阵

非埃尔米特矩阵的情况[编辑]

一个实矩阵M可能满足对所有的非零实向量xxTMx > 0而并不是对称矩阵。举例来说,矩阵

 \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix}

就满足这个条件。对x = (x_1, x_2)^T并且x \ne 0

 \begin{bmatrix} x_1 & x_2 \end{bmatrix} \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = x_1^2 + x_2^2 > 0 .

一般来说,一个实系数矩阵M满足对所有非零实向量x,有xTMx > 0,当且仅当对称矩阵 (M + MT) / 2是正定矩阵。

对于复系数矩阵,情况可能不太一样。主要看的是怎样扩展z*Mz > 0这一性质。要使z*Mz总为实数,矩阵M必须是埃尔米特矩阵。因此,若z*Mz总是正实数,M必然是正定的埃尔米特矩阵。如果将z*Mz > 0扩展为Re(z*Mz) > 0,则等价于(M+M*) / 2为正定阵。

参见[编辑]

参考来源[编辑]

  • Rajendra Bhatia. Positive definite matrices,. Princeton Series in Applied Mathematics, 2007. ISBN 978-0691129181.