奇异值分解
奇异值分解是线性代数中一种重要的矩阵分解,在信号处理、统计学等领域有重要应用。奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似。然而这两种矩阵分解尽管有其相关性,但还是有明显的不同。对称阵特征向量分解的基础是谱分析,而奇异值分解则是谱分析理论在任意矩阵上的推广。
目录 |
理論描述 [编辑]
假設M是一個m×n階矩陣,其中的元素全部屬於域 K,也就是 實數域或複數域。如此則存在一個分解使得
其中U是m×m階酉矩陣;Σ是半正定m×n階對角矩陣;而V*,即V的共軛轉置,是n×n階酉矩陣。這樣的分解就稱作M的奇異值分解。Σ對角線上的元素Σi,i即為M的奇異值。
常見的做法是将奇異值由大而小排列。如此Σ便能由M唯一確定了。(雖然U和V仍然不能確定。)
直觀的解釋 [编辑]
在矩陣M的奇異值分解中
- V的列(columns)組成一套對
的正交"輸入"或"分析"的基向量。這些向量是
的特徵向量。 - U的列(columns)組成一套對
的正交"輸出"的基向量。這些向量是
的特徵向量。 - Σ對角線上的元素是奇異值,可視為是在輸入與輸出間進行的純量的"膨脹控制"。這些是
及
的奇異值,並與U和V的行向量相對應。
奇异值和奇异向量, 以及他们与奇异值分解的关系 [编辑]
一个非负实数σ是M的一个奇异值仅当存在Km 的单位向量u和Kn的单位向量v如下 :
其中向量u 和v分别为σ的左奇异向量和右奇异向量。
对于任意的奇异值分解
矩阵Σ的对角线上的元素等于M的奇异值. U和V的列分别是奇异值中的左、右奇异向量。因此,上述定理表明:
- 一个m × n的矩阵至少有一个最多有 p = min(m,n)个不同的奇异值。
- 总是可以找到在Km 的一个正交基U,组成M的左奇异向量。
- 总是可以找到和Kn的一个正交基V,组成M的右奇异向量。
如果一个奇异值中可以找到两个左(或右)奇异向量是线性相关的,则称为退化。
非退化的奇异值具有唯一的左、右奇异向量,取决于所乘的单位相位因子eiφ(根据实际信号)。因此,如果M的所有奇异值都是非退化且非零,则它的奇异值分解是唯一的,因为U中的一列要乘以一个单位相位因子且同时V中相应的列也要乘以同一个相位因子。
根据定义,退化的奇异值具有不唯一的奇异向量。因为,如果u1和u2为奇异值σ的两个左奇异向量,则两个向量的任意规范线性组合也是奇异值σ一个左奇异向量,类似的,右奇异向量也具有相同的性质。因此,如果M 具有退化的奇异值,则它的奇异值分解是不唯一的。
例子 [编辑]
观察一个4x5的矩阵
M矩阵的奇异值分解如下 
注意到
在对角线上包含0. 一个对角线元素是0. 并且,因为矩阵
和
是 酉, 乘以各自个共轭系数并得出结果确定矩阵, 如下所示. 在这个例子中,由于
和
是实值, 他们各自是 正交矩阵.
and
必须注意的是这个奇异值分解值不是唯一的. 选择
使得
这也是一个合法的奇异值
与特征值分解的联系 [编辑]
奇异值分解在意义上看很一般,因此它可以适用于任意m×n矩阵,而特征分解只能适用于特定类型的方阵。不过,这两个分解之间是有关联的。 给定一个M的奇异值分解,根据上面的论述,两者的关系式如下:
关系式的右边描述了关系式左边的特征值分解。于是:
特殊情况下,当M是一个正规矩阵,即是一个方阵时,根据谱定理,M可以被一组特征向量单一对角化,所以它可以被写为:
其中U为一个酉矩阵,D为一个对角阵。如果M是半正定的,
的分解也是一个奇异值分解。
然而,在其他所有的M矩阵上,特征分解跟奇异值分解是不同。特征分解如下:
其中U是不需要是单式的,D也不需要是正半定的。而奇异值分解如下:
其中Σ是对角半正定矩阵,U 和 V是酉矩阵,两者除了通过矩阵M没有必然的联系。
存在性 [编辑]
矩阵的特征值 λ具有如下关系 M u = λ u. 当 M 是 Hermitian, 特征值的取值是可以取得的 使得 M 为真 n × n symmetric matrix.定义 f :Rn → R by f(x) = xT M x.根据 extreme value theorem, 在一些u上,这个连续性函数可以取得最大值 当取得严格的限定{||x|| ≤ 1}. 根据 Lagrange multipliers 理论, u 是需要满足的
在这里 nabla 符号,
, 是 del 算符.
简单的计算就可得到 M u = λ u (对称性 M是必须的). 因此 λ 是最大的特征值 M.相同的计算值表明正交分量 u 给于第二大的特征值. ; 这里f(x) = x* M x2n 是一个真值相关的 真变量.
基于谱定理 [编辑]
| 本条目翻譯品質不佳。 |
使得 M是一个m-by-n具有复杂特性的矩阵. M*M 是半正定和hermitian. 根据 spectral theorem, 这里存在 一个 unitary n-by-n 句子 V有如下
这里D是一个对角 和正定. 恰当的划分 V 我们有
因此 V1*M*MV1 = D and V2*M*MV2 = 0. The latter means MV2 = 0.
由于 V 是 unitary, V1*V1 = I, V2*V2 = I and V1V1* + V2V2* = I.
定义
于是有
这是我们想要的结果, 除了 U1 and V1 不是 unitary , 但仅仅isometries. 为了解决问题 我们简单的得到"fill out" 这些矩阵获得 unitaries. 例如, 我们可以选择U2 因此
是 unitary.
定义
这里多余的0行是加进去的或者删除的使零行数等于列数 U2. 由此
这是想要的结果:
注意该参数可以开始对角化 MM* 而不是 M*M (这显示 MM* and M*M 具有相同的非0特征值).
基于变特性 [编辑]
这个单一值可以定义为 uTMv, 考虑到函数 u and v, 在一个特别的子空间上. 这个向量代表这u and v 在这里m是可以获取的 使得 M 代表m × n 带有实值的矩阵. Let
and
代表这二维向量的集合 Rm and Rn各自的. 定义函数
有向量 u ∈
和v ∈
. 考虑函数 σ restricted to
×
. 由于两个
和
是 compact 集合, 他们的 product 也是相关的. 并且, 既然 σ是连续的, 他获得一个最大值,至少是一对向量值 u ∈
and v ∈
. 这个最大值 σ1 相关向量是 u1 和 v1. 既然
是最大值
这个是非负的. 如果是负的, 改变符号u1 or v1 将使得变正和变得更大.
状态: u1, v1 是左右奇异向量 M 和相关的向量 σ1.
证明:与特征值例子类似, 假设两个向量满足拉格朗日乘子方程:
经过代数变换, 就成为
and
乘以从左边的第一个方程
和左边的第二个方程
and taking ||u|| = ||v|| = 1 一起来考虑
So σ1 = 2 λ1 = 2 λ2. 函数特性 φ defined by
我们有
相似的
这证明了以下条目
更多的单一向量和单一值是建立在以下最大值 σ(u, v) 常规化 u, v这个正交于u1 and v1, 各自的. 这个实值对复数值是特征值的相似例子
几何意义 [编辑]
因为U 和V 向量都是单位化的向量, 我们知道U的列向量u1,...,um组成了Km空间的一组标准正交基。同样,V的列向量v1,...,vn也组成了Kn空间的一组标准正交基(根据向量空间的标准点积法则).
线性变换T: Kn → Km,把向量x变换为Mx。考虑到这些标准正交基,这个变换描述起来就很简单了: T(vi) = σi ui, for i = 1,...,min(m,n), 其中σi 是对角阵Σ中的第i个元素; 当i > min(m,n)时,T(vi) = 0。
这样,SVD理论的几何意义就可以做如下的归纳:对于每一个线性映射T: Kn → Km,T把Kn的第i个基向量映射为Km的第i个基向量的非负倍数,然后将余下的基向量映射为零向量。对照这些基向量,映射T就可以表示为一个非负对角阵。
简化的 SVD [编辑]
范数 [编辑]
1. 矩阵范数的概念 设A∈Cm×n,定义一个实值函数||A||,若满足:
(1) 非负性:||A||≥0,且||A||=0当且仅当A=0; (2) 齐次性:||aA||=|a| ||A||,a∈C; (3) 三角不等式:||A+B||≤||A||+||B||,A,B∈ Cm×n; (4) 相容性:||AB||≤||A|| ||B||
则称||A||为A的矩阵范数。 例1 设A=(aij)∈Cn×n,则
都是
定理2:由向量的1-范数、2-范数和∞-范数分别诱导出的矩阵范数分别是
通常依次称为列和范数、谱范数和行和范数。
定理3:谱范数和F-范数都是酉不变范数,即对于任意酉矩阵P和Q,有||PAQ||=||A||。
应用 [编辑]
求伪逆 [编辑]
奇异值分解可以被用来计算矩阵的伪逆。若矩阵 M 的奇异值分解为
,那么 M 的伪逆为
其中 Σ+ 是将Σ转置,并将其主对角线上每个非零元素都求倒数得到的。求伪逆通常可以用来求解线性最小平方问题。
平行奇异值模型 [编辑]
把频率选择性衰落信道进行分解.
值域、零空间和秩 [编辑]
矩阵近似值 [编辑]
奇异值分解在统计中的主要应用为主成分分析(PCA),种数据分析方法,用来找出大量数据中所隐含的“模式”,它可以用在模式识别,数据压缩等方面。PCA算法的作用是把数据集映射到低维空间中去。 数据集的特征值(在SVD中用奇异值表征)按照重要性排列,降维的过程就是舍弃不重要的特征向量的过程,而剩下的特征向量张成空间为降维后的空间。
幾種程式語言中计算SVD的函式範例 [编辑]
- matlab:
- [b c d]=svd(x)
- OpenCV:
- void cvSVD( CvArr* A, CvArr* W, CvArr* U=NULL, CvArr* V=NULL, int flags=0 )
历史 [编辑]
参见 [编辑]
外部链接 [编辑]
- LAPACK users manual gives details of subroutines to calculate the SVD (see also [1]).
- Applications of SVD on PC Hansen's web site.
- Introduction to the Singular Value Decomposition by Todd Will of the University of Wisconsin--La Crosse.
- Los Alamos group's book chapter has helpful gene data analysis examples.
- MIT Lecture series by Gilbert Strang. See Lecture #29 on the SVD.
- Java SVD library routine.
- Java applet demonstrating the SVD.
- Java script demonstrating the SVD more extensively, paste your data from a spreadsheet.
- Chapter from "Numerical Recipes in C" gives more information about implementation and applications of SVD.
- Online Matrix Calculator Performs singular value decomposition of matrices.
参考文献 [编辑]
- Demmel, J. and Kahan, W. (1990). Computing Small Singular Values of Bidiagonal Matrices With Guaranteed High Relative Accuracy. SIAM J. Sci. Statist. Comput., 11 (5), 873-912.
- Golub, G. H. and Van Loan, C. F. (1996). "Matrix Computations". 3rd ed., Johns Hopkins University Press, Baltimore. ISBN 0-8018-5414-8.
- Halldor, Bjornsson and Venegas, Silvia A. (1997). "A manual for EOF and SVD analyses of climate data". McGill University, CCGCR Report No. 97-1, Montréal, Québec, 52pp.
- Hansen, P. C. (1987). The truncated SVD as a method for regularization. BIT, 27, 534-553.
- Horn, Roger A. and Johnson, Charles R (1985). "Matrix Analysis". Section 7.3. Cambridge University Press. ISBN 0-521-38632-2.
- Horn, Roger A. and Johnson, Charles R (1991). Topics in Matrix Analysis, Chapter 3. Cambridge University Press. ISBN 0-521-46713-6.
- Strang G (1998). "Introduction to Linear Algebra". Section 6.7. 3rd ed., Wellesley-Cambridge Press. ISBN 0-9614088-5-5.


的
的
的








的
的特征向量。


















