舒尔补
在线性代数与矩阵论中,一个矩阵的子矩阵之舒尔补是一个与其余子阵同样大小的矩阵,定义如下:假设一个 (p+q)×(p+q) 的矩阵 M 被分为 A, B, C, D 四个部分,分别是p×p、p×q、q×p 以及 q×q 的矩阵,也就是说:
并且 D 是可逆的矩阵。则 D 在矩阵中的舒尔补是:
这是一个 p×p 的矩阵。
舒尔补得名于数学家伊赛·舒尔,后者用舒尔补来证明舒尔引理。然而,舒尔补的概念在之前就曾经被使用过[1]。
目录 |
背景 [编辑]
舒尔补实际上是对原来的矩阵 M 进行一系列的初等变换操作后得到的矩阵,其转换矩阵是下三角矩阵:
其中 Ip 表示一个 p×p 的单位矩阵。矩阵 M 右乘转换矩阵 L 之后,左上角就会出现舒尔补,具体的形式是:
因此,矩阵 M 的逆,如果存在的话,可以用
以及其舒尔补(如果存在的话)来表示:
当 p 和 q 都等于1 (即 A、B、C 和 D 都是系数)时,我们可以得到一般的 2 × 2 的矩阵的逆矩阵表达式:
这也说明了
是非零的数。
在矩阵方程求解中的应用 [编辑]
舒尔补很自然地可以在如下的方程组求解中发挥作用:
其中 x 以及 a 是 p 维的列向量,而 y 以及 b 则是 q 维的列向量。 矩阵 A、B、C、D 则同上面假设。将第二个方程左乘上矩阵
,并将得到后的方程与第一个相减,就得到:
因此,如果可以知道 D 以及 D 的舒尔补的逆矩阵,就可以解出未知量 x 之后带入第二个方程
就可以解出 y。这样,就将
矩阵的求逆问题转化成了分别求解一个 p×p 矩阵以及一个 q×q 矩阵的逆矩阵的问题。这样就大大减低了复杂度(计算量)。实际上,这要求矩阵 D 满足足够好的条件,以使得算法得以成立。
概率论和统计学中的应用 [编辑]
假设有分别属于 Rn 以及 Rm 的随机列向量 X, Y ,并且 Rn+m 中的向量对 (X, Y) 具有多维正态分布,其方差矩阵是对称的正定矩阵
那么 X 在 Y 给定时的条件方差 是矩阵 C 在 V 中的舒尔补:
参考来源 [编辑]
- ^ Zhang, Fuzhen. The Schur Complement and Its Applications. Springer. 2005. ISBN 0387242716.
![M=\left[\begin{matrix} A & B \\ C & D \end{matrix}\right]](http://upload.wikimedia.org/math/6/6/e/66eb0aebf60bfc9e21dabb25f1e399fe.png)

![L=\left[\begin{matrix} I_p & 0 \\ -D^{-1}C & D^{-1} \end{matrix}\right].](http://upload.wikimedia.org/math/3/4/2/342edc65b8055f1e4bd16b6427017af0.png)
![M\cdot L= \left[\begin{matrix} A & B \\ C & D \end{matrix}\right]\left[\begin{matrix} I_p & 0 \\ -D^{-1}C & D^{-1} \end{matrix}\right] = \left[\begin{matrix} A-BD^{-1}C & BD^{-1} \\ 0 & I_q \end{matrix}\right].](http://upload.wikimedia.org/math/c/f/b/cfb10512da5db0f8925e4dc1ca98ede9.png)
![= \left[ \begin{matrix} \left(A-B D^{-1} C \right)^{-1} & -\left(A-B D^{-1} C \right)^{-1} B D^{-1} \\ -D^{-1}C\left(A-B D^{-1} C \right)^{-1} & D^{-1}+ D^{-1} C \left(A-B D^{-1} C \right)^{-1} B D^{-1} \end{matrix} \right].](http://upload.wikimedia.org/math/5/1/4/51460767796e450a26c9aa7ff5a9de83.png)
![M^{-1} = \frac{1}{AD-BC} \left[ \begin{matrix} D & -B \\ -C & A \end{matrix}\right]](http://upload.wikimedia.org/math/1/0/c/10c05307fdc01f8faa6cfe961e13cad6.png)


![V=\left[\begin{matrix} A & B \\ B^T & C \end{matrix}\right].](http://upload.wikimedia.org/math/a/5/1/a51d4cd1c348552d6dda6168b7c9eb19.png)
