秩 (线性代数)

维基百科,自由的百科全书
跳转至: 导航搜索
线性代数
\mathbf{A} = \begin{bmatrix}
1 & 2 \\
3 & 4 \end{bmatrix}
向量 · 矩阵  · 行列式  · 线性空间

线性代数中,一个矩阵A列秩A线性獨立纵列的极大数目。类似地,行秩A的线性獨立的横行的极大数目。

矩阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵A。通常表示为r(A),rk(A)或rank A

行秩列秩相等性[编辑]

矩阵的行秩与列秩相等,是线性代数基本定理的重要组成部分. 其基本证明思路是,矩阵可以看作线性映射的变换矩阵,列秩为像空间的维度,行秩为非零原像空间的维度,因此列秩与行秩相等,即像空间的维度与非零原像空间的维度相等(这里的非零原像空间是指约去了零空间后的商空间:原像空间)。这从矩阵的奇异值分解就可以看出来。

给出这一结果的两种证明. 第一个证明是简短的,仅用到向量的线性组合的基本性质. 第二个证明利用了正交性[1]. 第一个证明利用了列空间的基, 第二个证明利用了行向量空间的基. 第一个证明适用于定义在标量域上的矩阵,第二个证明适用于内积空间。二者都适用于实或复的欧氏空间,也都易于修改去证明当A是线性变换的情形.

证明一[编辑]

A是一个m \times n的矩阵,其列秩为r. 因此矩阵A的列空间的维度是r. 令c_1,c_2,\ldots,c_rA的列空间的一组基,构成m \times r矩阵C的列向量C = [c_1,c_2,\ldots,c_r],并使得A的每个列向量是Cr个列向量的线性组合. 由矩阵乘法的定义,存在一个r \times n矩阵R, 使得A = CR. (A(i,j)元素是c_iR的第j个列向量的点积.)

现在,由于A = CR, A的每个行向量是R的行向量的线性组合,这意味着A的行向量空间被包含于R的行向量空间之中. 因此A的行秩 ≤ R的行秩. 但R仅有r行, 所以R的行秩 ≤ r = A的列秩. 这就证明了A的行秩 ≤ A的列秩.

把上述证明过程中的“行”与“列”交换,利用对偶性质同样可证A的列秩 ≤ A的行秩。更简单的方法是考虑A的转置矩阵A^\mathrm{T},则A的列秩 = A^\mathrm{T}的行秩 ≤ A^\mathrm{T}的列秩 = A的行秩. 这证明了A的列秩等于A的行秩. 证毕.

证明二[编辑]

Am \times n矩阵,其行秩是r. 因此A的行向量空间的维度是r,设x_1, x_2,\ldots, x_rA的行向量空间的一组基. 如果把这组基当作原像列向量看待,则向量集Ax_1, Ax_2,\ldots, Ax_r是线性独立的。 这是因为对一组标量系数c_1,c_2,\ldots,c_r,如果:

c_1 Ax_1 + c_2 Ax_2 + \cdots c_r Ax_r = A(c_1x_1 + c_2x_2 + \cdots + c_rx_r) = Av = 0,

其中v = c_1x_1 + c_2x_2 + \ldots,c_r x_r. 则可以推出有两个事实: (a) vA行向量空间的线性组合, 即v属于A的行向量空间;(b) 由于Av = 0, v正交于A的所有行向量,从而正交于A的行向量空间的所有向量. 事实(a)与(b)结合起来,则v正交于自身,这意味着v = 0. 由v的定义:

c_1x_1 + c_2x_2 + \ldots,c_r x_r = 0.

再由x_iA的行向量空间的一组线性独立的基,可知c_1 = c_2 = \cdots = c_r = 0. Ax_1, Ax_2,\ldots, Ax_r因而是线性独立的.

Ax_iA的列空间中的向量. 因此Ax_1, Ax_2,\ldots, Ax_rA的列空间中r个线性独立的向量. 所以A的列向量空间的维数(A的列秩)必然不小于r. 这证明了A的行秩r ≤ A的列秩. 把这一结果应用于A的转置矩阵可以得到: A的列秩 = A^\mathrm{T}的行秩 ≤ A^\mathrm{T}列秩 = A的行秩. 这证明了A的列秩等于A的行秩,证毕.

最后, 还可以证明rk(A) = rk(A*), 其中A*A的共轭转置或称施密特转置. 当A的元素都是实数, 这一结果变为rk(A) = rk(AT). 然而对于复系数矩阵,rk(A) = rk(A*)并不等价于行秩等于列秩, 需要用到上述两个证明.

证明三[编辑]

A是一个m×n矩阵. 定义rk(A)为A的列秩,A*A的共轭转置或称施密特转置. 首先可知A*Ax = 0当且仅当Ax = 0.

A*Ax = 0 ⇒ x*A*Ax = 0 ⇒ (Ax)*(Ax) = 0 ⇒ ‖Ax‖2 = 0 ⇒ Ax = 0,

其中‖·‖是欧氏范数. 这说明A的零空间与A*A的零空间相同. 由秩-零化度定理, 可得rk(A) = rk(A*A). A*A的每一个列向量是A*的列向量的线性组合. 所以A*A的列空间是A*的列空间的子空间. 从而rk(A*A) ≤ rk(A*). 即: rk(A) = rk(A*A) ≤ rk(A*). 应用这一结果于A*可或得不等式: since (A*)* = A, 可写作rk(A*) ≤ rk((A*)*) = rk(A). 这证明了rk(A) = rk(A*). 证毕.

可替代定义[编辑]

用向量组的秩定义[编辑]

向量组的秩:在一个 m线性空间 E 中,一个向量组 F=(C_1,C_2, \cdots , C_n) 的秩表示的是其生成的子空间的维度。考虑 m × n 矩阵 A=[C_1,C_2, \cdots , C_n],将 A 的秩定义为向量组 F 的秩,则可以看到如此定义的 A 的秩就是矩阵 A 的线性无关列向量的极大数目,即 A列空间维度(列空间是由A的纵列生成的Fm的子空间)。因为列秩和行秩是相等的,我们也可以定义A的秩为A行空间的维度。

用线性映射定义[编辑]

考虑线性映射

 f_A : F^n \to F^m
 x \mapsto A \cdot x

对于每个矩阵Af_A都是一个线性映射,同时,对每个F^n \to F^m 的 线性映射f,都存在矩阵A使得f=f_A。也就是说,映射

 \Phi : \mathcal{M}_n (\mathbb{K}) \to \mathcal{L}(F^n,F^m)
 A \mapsto f_A

是一个同构映射。所以一个矩阵A的秩还可定义为f_A的像的维度(像与核的讨论参见线性映射)。矩阵A称为f_A变换矩阵。这个定义的好处是适用于任何线性映射而不需要指定矩阵,因为每个线性映射有且仅有一个矩阵与其对应。秩还可以定义为nf的维度;秩-零化度定理声称它等于 f的像的维度。

性质[编辑]

我们假定A是在域F上的m × n矩阵并描述了上述线性映射。

  • m × n矩阵的秩不大于mn的一个非负整数,表示為 rk(A) ≤ min(m, n)。有尽可能大的秩的矩阵被称为有满秩;类似的,否则矩阵是秩不足(或称为“欠秩”)的。
  • 只有零矩阵有秩0
  • A的秩最大为min(m,n)
  • f单射,当且仅当A有秩n(在这种情况下,我们称A有“满列秩”)。
  • f满射,当且仅当A有秩m(在这种情况下,我们称A有“满行秩”)。
  • 在方块矩阵A (就是m = n)的情况下,则A可逆的,当且仅当A有秩n(也就是A有满秩)。
  • 如果B是任何n × k矩阵,则AB的秩最大为A的秩和B的秩的小者。即:
\operatorname{rank}(AB) \leq \min(\operatorname{rank}\ A, \operatorname{rank}\ B).
推广到若干个矩阵的情况,就是:秩(A1A2...Am)≤min(秩(A1),秩(A2),...秩(Am))
证明:
考虑矩阵的秩的线性映射的定义,令A、B对应的线性映射分别为fg,则AB表示复合映射f·g,它的象Im f·gg的像Im g在映射f作用下的象。然而Im g是整个空间的一部分,因此它在映射f作用下的象也是整个空间在映射f作用下的象的一部分。也就是说映射Im f·gIm f的一部分。对矩阵就是:秩(AB)≤秩(A)。
对于另一个不等式:秩(AB)≤秩(B),考虑Im g的一组:(e1,e2,...,en),容易证明(f(e1),f(e2),...,f(en))生成了空间Im f·g,于是Im f·g维度小于等于Im g的维度。对矩阵就是:秩(AB)≤秩(B)。
因此有:秩(AB)≤min(秩(A),秩(B))。若干个矩阵的情况证明类似。
作为"<"情况的一个例子,考虑积
  \begin{bmatrix}
    0 & 0 \\
    1 & 0 \\
  \end{bmatrix}
  \begin{bmatrix}
    0 & 0 \\
    0 & 1 \\
  \end{bmatrix}
两个因子都有秩1,而这个积有秩0。
可以看出,等号成立当且仅当其中一个矩阵(比如说A)对应的线性映射不减少空间的维度,即是单射,这时A是满秩的。于是有以下性质:
  • 如果B是秩nn × k矩阵,则
\operatorname{rank}(AB) = \operatorname{rank}(A).
  • 如果C是秩ml × m矩阵,则
\operatorname{rank}(CA) = \operatorname{rank}(A).
  • A的秩等于r,当且仅当存在一个可逆m × m矩阵X和一个可逆的n × n矩阵Y使得
 XAY =
  \begin{bmatrix}
    I_r & 0 \\
    0 & 0 \\
  \end{bmatrix}
这裡的Ir指示r × r 单位矩阵
证明可以通过高斯消去法构造性地给出。
  • 西尔维斯特不等式: 如果 A 是一个 m × n 的矩阵且 Bn × k 的, 则
\operatorname{rank}(A) + \operatorname{rank}(B) - n \leq \operatorname{rank}(A B).Template:Efn-lr
这是下一个不等式的特例.
  • 这个不等式是由Frobenius提出的: 如果 AB, ABCBC 有定义, 则
\operatorname{rank}(AB) + \operatorname{rank}(BC) \le \operatorname{rank}(B) + \operatorname{rank}(ABC).Template:Efn-lr
  • 子加性: rank(A + B) ≤ rank(A) + rank(B) when A and B are of the same dimension. As a consequence, a rank-k matrix can be written as the sum of k rank-1 matrices, but not fewer.
  • 矩阵的秩加上矩阵的零化度等于矩阵的纵列数(这就是秩-零化度定理)。
  • 如果 A实数上的矩阵,那么 A 的秩和它对应格拉姆矩阵的秩相等。于是,对于实矩阵
\operatorname{rank}(A^T A) = \operatorname{rank}(A A^T) = \operatorname{rank}(A) = \operatorname{rank}(A^T).
This can be shown by proving equality of their null spaces. Null space of the Gram matrix is given by vectors x for which A^T A x = 0. If this condition is fulfilled, also holds 0 = x^T A^T A x = |A x|^2.[2]
  • 如果 A复数上的矩阵且 A* 表示 A 的共轭转置(i.e., A伴随), 则
\operatorname{rank}(A) = \operatorname{rank}(\overline{A}) = \operatorname{rank}(A^T) = \operatorname{rank}(A^*) = \operatorname{rank}(A^*A).

向量组的线性相关性[编辑]

mn维列向量排列成n \times m的矩阵A,这个对应矩阵的秩即为原向量组的秩。

原向量组线性相关的充分必要条件为:

r(A) < m

如果

r(A) = m

则向量组线性无关。另外,不存在

r(A) > m

特殊的,若向量的个数m大于向量的维数n,则根据:

r(A) \le n < m

这个向量组必然线性相关。

计算[编辑]

计算矩阵A的秩的最容易的方式是高斯消去法,即利用矩阵的初等变换生成一个行阶梯型矩阵,由于矩阵的初等变换不改变矩阵的秩,因此A行梯阵形式有同A一样的秩。经过初等变换的矩阵的非零行的数目就是原矩阵的秩。

例如考虑4 × 4矩阵

  A =
  \begin{bmatrix}
    2 & 4 & 1 & 3 \\
    -1 & -2 & 1 & 0 \\
    0 & 0 & 2 & 2 \\
    3 & 6 & 2 & 5 \\
  \end{bmatrix}

我们看到第2纵列是第1纵列的两倍,而第4纵列等于第1和第3纵列的总和。第1和第3纵列是线性无关的,所以A的秩是2。这可以用高斯算法验证。它生成下列A的行梯阵形式:

  A =
  \begin{bmatrix}
    1 & 2 & 0 & 1 \\
    0 & 0 & 1 & 1 \\
    0 & 0 & 0 & 0 \\
    0 & 0 & 0 & 0 \\
  \end{bmatrix}

它有两个非零的横行。

在应用在计算机上的浮点数的时候,基本高斯消去(LU分解)可能是不稳定的,应当使用秩启示(revealing)分解。一个有效的替代者是奇异值分解(SVD),但还有更少代价的选择,比如有支点(pivoting)的QR分解,它也比高斯消去在数值上更强壮。秩的数值判定要求对一个值比如来自SVD的一个奇异值是否为零的依据,实际选择依赖于矩阵和应用二者。

应用[编辑]

计算矩阵的秩的一个有用应用是计算线性方程组解的数目。如果系数矩阵的秩等于增广矩阵的秩,则方程组只要有一个解。在这种情况下,它有精确的一个解,如果它的秩等于方程的数目。如果增广矩阵的秩大于系数矩阵的秩,则通解有k个自由参量,这裡的 k是在方程的数目和秩的差。否则方程组是不一致的。

控制论中,矩阵的秩可以用来确定线性系统是否为可控制的,或可观察的。

参见[编辑]

参考文献[编辑]

  1. ^ Mackiw, G. (1995). A Note on the Equality of the Column and Row Rank of a Matrix. Mathematics Magazine, Vol. 68, No. 4
  2. ^ Mirsky, Leonid. An introduction to linear algebra. Dover Publications. 1955年. ISBN 978-0-486-66434-7. 
  • Horn, Roger A. and Johnson, Charles R. Matrix Analysis. Cambridge University Press, 1985. ISBN 0-521-38632-2.
  • Kaw, Autar K. Two Chapters from the book Introduction to Matrix Algebra: 1. Vectors [1] and System of Equations [2]