矩陣範數

维基百科,自由的百科全书
跳转至: 导航搜索

矩陣範數matrix norm)是數學矩阵论线性代数泛函分析等领域中常见的基本概念,是将一定的矩阵空间建立为赋范向量空间时为矩阵装备的范数。应用中常将有限维赋范向量空间之间的映射以矩阵的形式表现,这时映射空间上装备的范数也可以通过矩阵范数的形式表达。

矩阵范数却不存在公认唯一的度量方式。

定义[编辑]

赋范向量空间拓扑向量空间中的基本种类。通过赋予向量空间(线性空间)以范数,建立拓扑结构。考虑系数\mathbb{K}\mathbb{K}可以是实数域\mathbb{R}複数域\mathbb{C}等)上的所有 m \times n矩阵所构成的向量空间\mathcal{M}_{m, n}(\mathbb{K})。这是一个有m n维的\mathbb{K}-向量空间。可以如同对其他的有限维\mathbb{K}-向量空间一样,为矩阵空间\mathcal{M}_{m, n}(\mathbb{K})装备范数。这样的范数称为\mathcal{M}_{m, n}(\mathbb{K})上的一个矩阵范数。

依照范数的定义,一个从\mathcal{M}_{m, n}(\mathbb{K})映射到非负实数的函数\| \cdot \|满足以下的条件:

  • 严格正定性:对任意矩阵A \in \mathcal{M}_{m, n}(\mathbb{K}),都有\|A\|\ge 0,且等號成立若且唯若A=0
  • 线性性:对任意系数\alpha \in \mathbb{K}、任意矩阵A \in \mathcal{M}_{m, n}(\mathbb{K}),都有\|\alpha A\|=|\alpha| \|A\|
  • 三角不等式:任意矩阵A, B \in \mathcal{M}_{m, n}(\mathbb{K}),都有\|A+B\| \le \|A\|+\|B\|。则称之为\mathcal{M}_{m, n}(\mathbb{K})上的一个矩阵范数。

此外,某些定義在方块矩阵组成空间\mathcal{M}_{n}(\mathbb{K})上的矩陣範數滿足一個或多個以下與的條件:

  • 一致性\|AB\| \le \|A\|\|B\|
  • 共轭转置相等条件\|A\|=\|A^*\|。其中A^*表示矩阵A共轭转置(在實矩陣中就是普通轉置)。

一致性特性(consistency property)也稱為次可乘性(sub-multiplicative property)。某些书籍中,矩阵范数特指满足一致性条件的范数。

常见矩阵范数[编辑]

满足以上设定的矩阵范数可以有多种。由于它们都是定义在\mathcal{M}_{m, n}(\mathbb{K})这个有限维向量空间上的范数,所以实质上是等价的。常见的矩阵范数通常是在矩阵的应用中自然定义或诱导的范数。

向量范数诱导的矩阵範数[编辑]

考虑从向量空间V = \mathbb{K}^m映射到W = \mathbb{K}^n的所有线性映射的构成的空间:\mathcal{L}_{m, n}(\mathbb{K})。设VW中分别装备了两个向量范数\| \cdot \|_V\| \cdot \|_W,则可以定义\mathcal{L}_{m, n}(\mathbb{K})上的算子范数\| \cdot \|_\mathcal{L}

\forall A \in \mathcal{L}_{m, n}(\mathbb{K}) 
\|A\|_\mathcal{L} = \max\{\|A(x)\|_W \; ; \; \; x\in V , \; \; \|x\|_V \leqslant 1\}

而给定了基底後,每个从V映射到W的线性映射都可以用一个m \times n的矩阵来表示,所以同样地可以定义\mathcal{M}_{m, n}(\mathbb{K})上的非负映射\| \cdot \|_\mathcal{M}

\forall A \in \mathcal{M}_{m, n}(\mathbb{K}) 
\|A\|_\mathcal{L} = \max\{\|A(x)\|_W \; ; \; \; x\in V , \; \; \|x\|_V \leqslant 1\}

可以验证,\| \cdot \|_\mathcal{M}满足矩阵范数的定义,因此是一个矩阵范数。这个矩阵范数被称为是由向量空间范数诱导的矩阵范数,可以看作是算子范数在由有限维向量空间之间线性映射组成的空间上的特例。如果m = n,所对应的矩阵空间就是n阶方块矩阵空间\mathcal{M}_{n}(\mathbb{K})。这时可以验证,诱导范数\| \cdot \|_\mathcal{M}满足一致性条件。

p-范数诱导的矩阵范数[编辑]

VW中装备的向量范数都是p-范数的时候,诱导的矩阵范数也称为矩阵的诱导p-范数。具体来说就是:

 \left\| A \right\|_p = \max \limits_{x \ne 0} \frac{\left\| A x \right\|_p}{\left\| x \right\|_p} = \max \limits_{x \ne 0} \frac{\left(\sum_{i=1}^n | \sum_{j=1}^m A_{ij} x_j |^p\right)^{1/p}}{\left(\sum_{i=1}^m |  x_i |^p\right)^{1/p}}

p=1p=\infty的情況下,其範數可以以下方式計算:

 \begin{align}
& \left \| A \right \| _1 = \max \limits _{1 \leq j \leq n} \sum _{i=1} ^m | a_{ij} | \\
& \left \| A \right \| _\infty = \max \limits _{1 \leq i \leq m} \sum _{j=1} ^n | a_{ij} | .
\end{align}

這些與矩陣的Schatten p-範数不同,也可以用 \left \| A \right \| _p 。來表示。

p = 2(欧几里德範数)且m = n(方陣)時,诱导的矩阵範数就是谱範数。矩陣A的谱範数是A最大的奇異值半正定矩阵A*A的最大特徵值的平方根:

\left \| A \right \| _2=\sqrt{\lambda_{\text{max}}(A^* A)}

其中A*代表A共轭转置

任何诱导的矩陣範數都滿足此不等式

\left \| A \right \| \ge \rho(A),

其中ρ(A)是A谱半径。事實上,可以证明ρ(A)是A的所有诱导範数的下界。

此外,我們有

\lim_{r\rarr\infty}\|A^r\|^{1/r}=\rho(A)

矩阵元範数[编辑]

這些向量範數将矩阵视为m \times n向量,并使用类似的向量範數。

舉例說明,使用向量的p-範数,我們得到:

\Vert A \Vert_{p} = \Big( \sum_{i=1}^m \sum_{j=1}^n |a_{ij}|^p \Big)^{1/p}. \,

注:不要把矩阵元p-範数与诱导p-範数混淆。

弗罗贝尼乌斯範数[编辑]

p = 2,这称为弗罗贝尼乌斯範数(Frobenius norm)或希尔伯特-施密特範数(Hilbert–Schmidt norm),不过后面这个术语通常只用于希尔伯特空间。这个範数可用不同的方式定义:

\|A\|_F=\sqrt{\sum_{i=1}^m\sum_{j=1}^n |a_{ij}|^2}=\sqrt{\operatorname{trace}(A^{{}^*} A)}=\sqrt{\sum_{i=1}^{\min\{m,\,n\}} \sigma_{i}^2}

这里A*表示A共轭转置σiA奇异值,并使用了迹函数。弗罗贝尼乌斯範数与Kn上欧几里得範数非常类似,来自所有矩阵的空间上一个内积

弗罗贝尼乌斯范範数是服从乘法的且在数值线性代数中非常有用。这个範数通常比诱导範数容易计算。

极大範範数[编辑]

极大範範数p=∞的元素範数,

\|A\|_{max}=\max\{|a_{ij}|\}。这个範数不服从乘法。

Schatten範数[编辑]

Schaten範数出现于当p-範数应用于一个矩阵的奇异值向量时。如果奇异值记做σi,则Schatten p-範数定义为

 \|A\|_p = \Big( \sum_{i=1}^{\min\{m,\,n\}} \sigma_i^p \Big)^{1/p}. \,

这个範数与诱导、元素p-範数使用了同样的记号,但它们是不同的。

所有Schatten範数服从乘法。它们也都是酉不变的,这就是说||A|| = ||UAV|| 对所有矩阵A与所有酉矩阵UV

最常见的情形是p = 1, 2, ∞。p = 2得出弗罗贝尼乌斯範数,前面已经介绍过了。p = ∞得出谱範数,这是由向量2-範数诱导的矩阵範数(见下)。最后,p = 1得出迹範数,定义为

\|A\|_{\text{tr}}
=\operatorname{trace}(\sqrt{A^*A})=\sum_{i=1}^{\min\{m,\,n\}} \sigma_{i}

一致範数[编辑]

一个K^{m \times n}上矩阵範数\| \cdot \|_{ab}称为与K^n上向量範数\| \cdot \|_{a}以及K^m上向量範数\| \cdot \|_{b}一致,如果

\|Ax\|_b \leq \|A\|_{ab} \|x\|_a

对所有A \in K^{m \times n}, x \in K^n。根据定义,所有诱导範数是一致範数。

範数的等价[编辑]

对任何两个向量範数||·||α and ||·||β,我们有

r\left\|A\right\|_\alpha\leq\left\|A\right\|_\beta\leq s\left\|A\right\|_\alpha

对某个正数rsK^{m \times n}中所有矩阵A成立。换句话说,它们是等价的範数;它们在K^{m \times n}上诱导了相同的拓扑

此外,当A\in \mathbb{R}^{n\times n},则对任何向量範数 ||·||,存在惟一一个正数k使得k||A|| 是一个(服从乘法)矩阵範数。

一个矩阵範数||·||α称为“极小的”,如果不存在其它矩阵範数||·||β满足||·||β≤||·||α

範数等价的例子[编辑]

对矩阵A\in\mathbb{R}^{m\times n}如下不等式成立[1][2]

  • \|A\|_2\le\|A\|_F\le\sqrt{n}\|A\|_2
  • \|A\|_{\text{max}} \le \|A\|_2 \le \sqrt{mn}\|A\|_{\text{max}}
  • \frac{1}{\sqrt{n}}\|A\|_\infty\le\|A\|_2\le\sqrt{m}\|A\|_\infty
  • \frac{1}{\sqrt{m}}\|A\|_1\le\|A\|_2\le\sqrt{n}\|A\|_1

这里,||·||p表示由向量p-範数诱导的矩阵範数。

向量範数之间另一个有用的不等式是

\|A\|_2\le\sqrt{\|A\|_1\|A\|_\infty}

參考資料[编辑]

  1. ^ Golub, Gene; Van Loan, Charles F., Matrix Computations 3rd, Baltimore: The Johns Hopkins University Press, 56–57, 1996, ISBN 0-8018-5413-X 
  2. ^ Horn, =Roger; Johnson, Charles, Matrix Analysis, Cambridge University Press, 1985, ISBN 0-521-38632-2 
  1. Douglas W. Harder, Matrix Norms and Condition Numbers [1]
  2. James W. Demmel, Applied Numerical Linear Algebra, section 1.7, published by SIAM, 1997.
  3. Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, published by SIAM, 2000. [2]