结构相似性

维基百科,自由的百科全书
跳到导航 跳到搜索

结构相似性指标[1](英文:structural similarity index,SSIM index)是一种用以衡量两张数位影像相似程度的指标。当两张影像其中一张为无失真影像,另一张为失真后的影像,二者的结构相似性可以看成是失真影像的影像品质衡量指标。相较于传统所使用的影像品质衡量指标,像是峰值信噪比(英语:PSNR),结构相似性在影像品质的衡量上更能符合人眼对影像品质的判断[2][3]

基本观念[编辑]

结构相似性的基本观念为自然影像是高度结构化的[1],亦即在自然影像中相邻像素之间有很强的关联性,而这样的关联性承载了场景中物体的结构资讯。人类视觉系统在观看影像时已经很习惯抽取这样的结构性资讯。因此,在设计影像品质衡量指标用以衡量影像失真程度时,结构性失真的衡量是很重要的一环。

定义[编辑]

给定两个信号,两者的结构相似性定义为:



其中,比较亮度比较对比度比较的结构(structure),,为调整相对重要性的参数,分别为平均值标准差协方差皆为常数,用以维持的稳定。

结构相似性指标的值越大,代表两个信号的相似性越高。

试想,若使用全等的两张图片去做SSIM运算,也就是说,如此一来

性质[编辑]

结构相似性指标具有下列性质:

结构相似性指标是对称的,亦即
  • 有上下界
结构相似性指标的范围为−1到1。当衡量的两个信号完全相同时,结构相似性指标的值为1。

使用[编辑]

实际使用时,简化起见,一般会将参数设为,得到:

在计算两张影像的结构相似性指标时,会开一个局部性的视窗,一般为×的小区块,计算出视窗内信号的结构相似性指标,每次以像素为单位移动视窗,直到整张影像每个位置的局部结构相似性指标都计算完毕。将全部的局部结构相似性指标平均起来即为两张影像的结构相似性指标。

应用[编辑]

结构相似性指标因其简单而有效,近年来广泛被使用在影像与视讯处理的相关应用上,像是影像压缩[4]影像浮水印[5]无线视讯串流[6]核磁共振成像[7]等等。

限制[编辑]

结构相似性指标有其限制,对于影像出现位移缩放旋转(皆属于非结构性的失真)的情况无法有效的运作。为解决此问题,另已发展出在小波域进行运算的结构相似性指标,称作复小波结构相似性指标[8](英文:complex wavelet SSIMCW-SSIM)。

外部链接[编辑]

参考资料[编辑]

  1. ^ 1.0 1.1 Zhou Wang, Alan C. Bovik, Hamid R. Sheikh, and Eero P. Simoncelli, "Image quality assessment: from error visibility to structural similairty," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600−612, Apr. 2004.
  2. ^ Zhou Wang and Alan C. Bovik, "Mean squared error: Love it or leave it? - A new look at signal fidelity measures," IEEE Signal Processing Magazine, vol. 26, no. 1, pp 98−117, Jan. 2009.
  3. ^ H.R. Sheikh, M.F. Sabir, and A.C. Bovik, "A statistical evaluation of recent full reference image quality assessment algorithms," IEEE Transactions on Image Processing, vol.15, no.11, pp.3440−3451, Nov. 2006.
  4. ^ T. Richter, K. J. Kim, "A MS-SSIM optimal JPEG 2000 encoder," in Proc. Data Compression Conf., pp.401−410, Mar. 2009.
  5. ^ A. M. Alattar, E. T. Lin, and M. U. Celik, "Digital watermarking of low bit-rate advanced simple profile MPEG-4 compressed video," IEEE Trans. Circuits Syst. Video Technol., vol. 13, no. 8, pp. 787−800, Aug. 2003.
  6. ^ V. Vukadinovi and G. Karlsson, "Trade-offs in bit-rate allocation for wireless video streaming," in Proc. ACM Int. Symp. Modeling, Analysis, and Simulation of Wireless and Mobile Systems, Quebec, Canada, 2005, pp. 349−353
  7. ^ S. A. Reinsberg, S. J. Doran, E. M. Charles-Edwards, and M. O. Leach, "A complete distortion correction for MR images: II. Rectification of static-field inhomogeneities by similarity-based profile mapping," Phys. Med. Biol., vol. 50, no. 11, pp. 2651−2661, June 2005.
  8. ^ Z. Wang and E. P. Simoncelli, "Translation insensitive image similarity in complex wavelet domain," in Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing, pp. 573−576, Mar. 2005.