心理視覺增強

維基百科,自由的百科全書

心理視覺增強(英語:psychovisual enhancements)或稱自適應增強adaptive quantization)、明亮掩碼lumi masking[1][2],是一種由心理物理學啟發的數字圖像數字視頻處理技術,用於改善圖像與視頻的主觀質量。

理論[編輯]

根據心理物理學韋伯定理,同一類刺激的最小可覺差與刺激的大小成比例。在圖像與視頻應用中,這一定理就體現為人對細節區域(比如,邊緣)的相鄰像素差異較為敏感,而對平滑區域差異則相對不敏感。因此可以對細節區域增加對比度,而對平滑區域減少對比度,從而在總的比特數量級不變的情況下,提高整體的主觀質量。

在圖像與視頻壓縮中的應用[編輯]

圖像壓縮視頻壓縮算法中,量化過程是比特數得以減小的原因,不過也是產生失真的源頭。同理,也可以對細節區域「細量化」,而對平滑區域「粗量化」,從而在保證一定壓縮效率的同時提高主觀質量。

圖像與視頻壓縮質量的評估[編輯]

壓縮過程產生失真是不可避免的。通過比較原始的和壓縮的圖像和視頻的畫質,可以確定出壓縮過程所產生的失真程度。評估準則有主觀質量和客觀質量。客觀質量通常通過計算峰值信噪比得出,峰值信噪比越高則客觀質量越好。主觀質量則是通過人的視覺感受進行衡量,具有一定的不確定性。

參考資料[編輯]

  1. ^ 康牧,王寶樹. 基于人眼视觉特性的彩色图像自适应增强算法. 光學學報. 2009年11月, 29: 3019–3023 [2015-04-02]. (原始內容存檔於2020-10-16). 
  2. ^ 劉江,蘇未曰. 基于人眼视觉特性的图像质量评价方法研究. 中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集. 2007年 [2015-04-02]. (原始內容存檔於2021-02-22). 

外部連結[編輯]