K-L 轉換

维基百科,自由的百科全书
跳转至: 导航搜索

K-L轉換(Karhunen-Loève Transform)是建立在統計特性基礎上的一種轉換,它是均方差(MSE, Mean Square Error)意義下的最佳轉換,因此在資料壓縮技術中佔有重要的地位。K-L轉換是對輸入的向量x,做一個正交變換,使得輸出的向量得以去除數據的相關性。

然而,K-L轉換雖然具有均方差(MSE)意義下的最佳轉換,但必須事先知道輸入的訊號,並且需經過一些繁雜的數學運算,例如共變異數(covariance)以及特徵向量(eigenvector)的計算。因此在工程實踐上K-L轉換並沒有被廣泛的應用,不過K-L轉換是理論上最佳的方法,所以在尋找一些不是最佳、但比較好實現的一些轉換方法時,K-L轉換能夠提供這些轉換性能的評價標準。

原理[编辑]

K-L轉換的目的是將原始數據做轉換,使得轉換後資料的相關性最小。若輸入數據為一維:

y[u]=\sum_{n=0}^{N-1}K[u,n]x[n]

K[u,n]=e_{n}[n]

其中en為輸入訊號x共變異數矩陣(covariance matrix)Cx特徵向量(eigenvector)

C_{x}=E[xx^{T}]-\bar{x}\bar{x}^{T}

C_{x}[m,n]=E[(x[m]-\overline{x[m]})(x[n]-\overline{x[n]})]


K-L轉換亦可表示成以下的矩陣乘法

y={\Phi}x

其中Φ為輸入訊號x共變異數矩陣(covariance matrix)Cx特徵向量(eigenvector)所組成的矩陣


若輸入訊號x為二維:

y[u,v]=\sum_{m=0}^{M-1}\sum_{n=0}^{N-1}K[u,m]K[v,m]x[m,n]

證明[编辑]

令Cx, Cy分別為x, y的共變異數矩陣(covariance matrix)

C_{x}=E[xx^{T}]-\bar{x}\bar{x}^{T}

C_{y}=E[yy^{T}]-\bar{y}\bar{y}^{T}
=E[({\Phi}x)({\Phi}x)^{T}]-({\Phi}\bar{x})({\Phi}\bar{x})^{T}
=E[{\Phi}(xx^{T}){\Phi}^{T}]-{\Phi}\bar{x}\bar{x}^{T}{\Phi}^{T}
={\Phi}(E[xx^{T}]-\bar{x}\bar{x}^{T}){\Phi}^{T}
={\Phi}C_{x}{\Phi}^{T}

由於Φ為Cx特徵向量(eigenvector)所組成的矩陣,故Cy為一對角矩陣(diagonal matrix)。由此可見,做了K-L轉換之後,對於任意i≠j,yi、yj共變異數(covariance)皆為0,即 COV(y_{i}, y_{j})=0 , if i≠j。因此,輸出訊號y的相關係數也為0,如此便是除去了資料的相關性。

應用[编辑]

在影像的壓縮上,目的是要將原始的影像檔用較少的資料量來表示,由於大部分的影像並不是隨機的分布,相鄰的像素(Pixal)間存在一些相關性,如果我們能找到一種可逆轉換(reversible transformation),它可以去除數據的相關性,如此一來就能更有效地儲存資料,由於K-L轉換是一種線性轉換,並有去除資料相關性的特性,便可以將它應用在影像的壓縮上。此外,由於K-L轉換具有將訊號轉到特徵空間(eigenspace)的特性,因此也可以應用在人臉辨識上。