线性代数
A
=
[
1
2
3
4
]
{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}
向量 · 向量空间 · 行列式 · 矩阵
在线性代数 裡,正定矩阵 (英語:positive-definite matrix )是埃尔米特矩阵 的一种,有时会简称为正定阵 。在线性代数 中,正定矩阵的性质類似复数 中的正 实数 。与正定矩阵相对应的线性算子 是对称 正定双线性形式 (複域中则对应埃尔米特 正定双线性形式 )。
一个n ×n 的实对称矩阵
M
{\displaystyle M}
是正定 的,当且仅当 对于所有的非零实系数向量 z ,都有z T
M
{\displaystyle M}
z > 0 。其中z T 表示z 的转置 。
对于复数 的情况,定义则为:一个n ×n 的埃尔米特矩阵 (或厄米矩阵)
M
{\displaystyle M}
是正定的当且仅当对于每个非零的複向量z ,都有z *
M
{\displaystyle M}
z > 0。其中z * 表示z 的共轭转置 。由于
M
{\displaystyle M}
是埃尔米特矩阵 ,经计算可知,对于任意的複向量z ,z *
M
{\displaystyle M}
z 必然是实数,从而可以与0比较大小。因此这个定义是自洽的。
判别正定阵 [ 编辑 ]
对n ×n 的埃尔米特矩阵
M
{\displaystyle M}
,下列性质与“
M
{\displaystyle M}
为正定矩阵”等价:
对于实对称矩阵 ,只需将上述性质中的
C
n
{\displaystyle \mathbb {C} ^{n}}
改为
R
n
{\displaystyle \mathbb {R} ^{n}}
,将“共轭转置”改为“转置”就可以了。
二次型 [ 编辑 ]
由以上的第二个等价条件,可以得到二次型 形式下正定矩阵的等价条件:用
K
{\displaystyle \mathbb {K} }
代表
C
{\displaystyle \mathbb {C} }
或
R
{\displaystyle \mathbb {R} }
,设
V
{\displaystyle \mathbb {V} }
是
K
{\displaystyle \mathbb {K} }
上的一个向量空间 。一个埃尔米特型 :
B
:
V
×
V
→
K
{\displaystyle B:V\times V\rightarrow K}
是一个双线性映射 ,使得B (x , y )总是B (y , x )的共轭 。这样的一个映射B 是正定 的当且仅当对
V
{\displaystyle \mathbb {V} }
中所有的非零向量x ,都有B (x , x ) > 0。
负定、半定及不定矩阵 [ 编辑 ]
与正定矩阵相对应的,一个n ×n 的埃尔米特矩阵
M
{\displaystyle M}
是负定矩阵 (英語:negative definite matrix )当且仅当对所有不为零的
z
∈
R
n
{\displaystyle z\in \mathbb {R} ^{n}}
(或
z
∈
C
n
{\displaystyle z\in \mathbb {C} ^{n}}
),都有:
z
∗
M
z
<
0
{\displaystyle z^{*}Mz<0\,}
M
{\displaystyle M}
是半正定矩阵 (英語:positive semi-definite matrix )当且仅当对所有不为零的
z
∈
R
n
{\displaystyle z\in \mathbb {R} ^{n}}
(或
z
∈
C
n
{\displaystyle z\in \mathbb {C} ^{n}}
),都有:
z
∗
M
z
≥
0
{\displaystyle z^{*}Mz\geq 0}
M
{\displaystyle M}
是半负定矩阵 (英語:negative semi-definite matrix )当且仅当对所有不为零的
z
∈
R
n
{\displaystyle z\in \mathbb {R} ^{n}}
(或
z
∈
C
n
{\displaystyle z\in \mathbb {C} ^{n}}
),都有:
z
∗
M
z
≤
0
{\displaystyle z^{*}Mz\leq 0}
如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵 (英語:indefinite matrix )。
可以看出,上一节中正定阵的等价性质1只需略作相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当M 是半正定时,相应的格拉姆矩阵 不必由线性无关的向量组成。对任意矩阵
A
{\displaystyle A}
,A * A 必然是半正定的,并有rank(
A
{\displaystyle A}
) = rank(A * A ,两者的秩 相等)。反过来,任意的半正定矩阵都可以写作M = A * A ,这就是科列斯基分解 。
一个埃尔米特矩阵M 是负定矩阵当且仅当M 的所有奇数阶顺序主子式小于0,所有偶数阶顺序主子式大于0。当M 是负定矩阵时,M 的逆矩阵也是负定的。
相关性质 [ 编辑 ]
若
M
{\displaystyle M}
为半正定阵,可以写作
M
≥
0
{\displaystyle M\geq 0}
。如果
M
{\displaystyle M}
是正定阵,可以写作
M
>
0
{\displaystyle M>0}
。这个记法来自泛函分析 ,其中的正定阵定义了正算子 。
对于一般的埃尔米特矩阵,
M
{\displaystyle M}
、
N
{\displaystyle N}
,
M
≥
N
{\displaystyle M\geq N}
当且仅当
M
−
N
≥
0
{\displaystyle M-N\geq 0}
。这样可以定义一个在埃尔米特矩阵集合上的偏序关系 。类似地,可以定义
M
>
N
{\displaystyle M>N}
。
1.
每个正定阵都是可逆的 ,它的逆也是正定阵。如果
M
≥
N
>
0
{\displaystyle M\geq N>0}
那么
N
−
1
≥
M
−
1
>
0
{\displaystyle N^{-1}\geq M^{-1}>0}
。
2.
如果
M
{\displaystyle M}
是正定阵,
r
>
0
{\displaystyle r>0}
为正实数,那么
r
M
{\displaystyle rM}
也是正定阵。
如果
M
{\displaystyle M}
、
N
{\displaystyle N}
是正定阵,那么和
M
+
N
{\displaystyle M+N}
、乘积
M
N
M
{\displaystyle MNM}
与
N
M
N
{\displaystyle NMN}
都是正定的。如果
M
N
=
N
M
{\displaystyle MN=NM}
,那么
M
N
{\displaystyle MN}
仍是正定阵。
3.
如果
M
=
(
m
i
j
)
>
0
{\displaystyle M=(m_{ij})>0}
那么主对角线上的系数
m
i
i
{\displaystyle m_{ii}}
为正实数。于是有
tr
(
M
)
>
0
{\displaystyle {\text{tr}}(M)>0}
。此外还有
|
m
i
j
|
≤
m
i
i
m
j
j
≤
m
i
i
+
m
j
j
2
{\displaystyle |m_{ij}|\leq {\sqrt {m_{ii}m_{jj}}}\leq {\frac {m_{ii}+m_{jj}}{2}}}
。
4.
矩阵
M
{\displaystyle M}
是正定阵当且仅当存在唯一的正定阵
B
>
0
{\displaystyle B>0}
使得
B
2
=
M
{\displaystyle B^{2}=M}
。根据其唯一性可以记作
B
=
M
1
/
2
{\displaystyle B=M^{1/2}}
,称
B
{\displaystyle B}
为
M
{\displaystyle M}
的平方根。对半正定阵也有类似结论。同时,如果
M
>
N
>
0
{\displaystyle M>N>0}
那么
M
1
/
2
>
N
1
/
2
>
0
{\displaystyle M^{1/2}>N^{1/2}>0}
。
5.
如果
M
,
N
>
0
{\displaystyle M,N>0}
那么
M
⊗
N
>
0
{\displaystyle M\otimes N>0}
,其中
⊗
{\displaystyle \otimes }
表示克罗内克乘积 。
6.
对矩阵
M
=
(
m
i
j
)
,
N
=
(
n
i
j
)
{\displaystyle M=(m_{ij}),N=(n_{ij})}
,将两者同一位置上的系数相乘所得的矩阵记为
M
∘
N
{\displaystyle M\circ N}
,即
M
∘
N
i
,
j
=
m
i
j
n
i
j
{\displaystyle M\circ N_{i,j}=m_{ij}n_{ij}}
,称为
M
{\displaystyle M}
与
N
{\displaystyle N}
的阿达马乘积 。如果
M
,
N
>
0
{\displaystyle M,N>0}
,那么
M
∘
N
>
0
{\displaystyle M\circ N>0}
。如果
M
,
N
{\displaystyle M,N}
为实系数矩阵 ,则有如下不等式成立:
det
(
M
∘
N
)
≥
(
det
N
)
∏
i
m
i
i
{\displaystyle \det(M\circ N)\geq (\det N)\prod _{i}m_{ii}}
。
7.
设
M
>
0
{\displaystyle M>0}
,
N
{\displaystyle N}
为埃尔米特矩阵。如果
M
N
+
N
M
≥
0
{\displaystyle MN+NM\geq 0}
(
M
N
+
N
M
>
0
{\displaystyle MN+NM>0}
),那么
N
≥
0
{\displaystyle N\geq 0}
(
N
>
0
{\displaystyle N>0}
)。
8.
如果
M
,
N
≥
0
{\displaystyle M,N\geq 0}
为实系数矩阵,则
tr
(
M
N
)
≥
0
{\displaystyle {\text{tr}}(MN)\geq 0}
。
9.
如果
M
>
0
{\displaystyle M>0}
为实系数矩阵,那么存在
δ
>
0
{\displaystyle \delta >0}
使得
M
≥
δ
I
{\displaystyle M\geq \delta I}
,其中
I
{\displaystyle I}
为单位矩阵 。
非埃尔米特矩阵的情况 [ 编辑 ]
一个实矩阵M 可能满足对所有的非零实向量x ,x T M x > 0而并不是对称矩阵。举例来说,矩阵
[
1
1
−
1
1
]
{\displaystyle {\begin{bmatrix}1&1\\-1&1\end{bmatrix}}}
就满足这个条件。对
x
=
(
x
1
,
x
2
)
T
{\displaystyle x=(x_{1},x_{2})^{T}}
并且
x
≠
0
{\displaystyle x\neq 0}
,
[
x
1
x
2
]
[
1
1
−
1
1
]
[
x
1
x
2
]
=
x
1
2
+
x
2
2
>
0
{\displaystyle {\begin{bmatrix}x_{1}&x_{2}\end{bmatrix}}{\begin{bmatrix}1&1\\-1&1\end{bmatrix}}{\begin{bmatrix}x_{1}\\x_{2}\end{bmatrix}}=x_{1}^{2}+x_{2}^{2}>0}
一般来说,一个实系数矩阵M 满足对所有非零实向量x ,有x T M x > 0,当且仅当对称矩阵 (M + M T ) / 2是正定矩阵。
对于复系数矩阵,情况可能不太一样。主要看的是怎样扩展z * M z > 0这一性质。要使z * M z 总为实数,矩阵M 必须是埃尔米特矩阵。因此,若z * M z 总是正实数,M 必然是正定的埃尔米特矩阵。如果将z * M z > 0扩展为Re(z * M z ) > 0,则等价于(M +M * ) / 2为正定阵。
参考资料 [ 编辑 ]
Roger A. Horn and Charles R. Johnson. Matrix Analysis, Chapter 7. Cambridge University Press, 1985. ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (paperback).
Rajendra Bhatia. Positive definite matrices, . Princeton Series in Applied Mathematics, 2007. ISBN 978-0691129181 .
外部链接 [ 编辑 ]