哈爾特徵

維基百科,自由的百科全書
跳到: 導覽搜尋

哈爾特徵Haar-like features) 是用於物體識別的一種數字圖像特徵。它們因為與哈爾小波轉換 極為相似而得名,是第一種即時的人臉檢測運算。

歷史上,直接使用圖像的強度(就是圖像每一個像素點的RGB值)使得特徵的計算強度很大。帕帕喬治奧等人提出可以使用基於哈爾小波的特徵而不是圖像強度[1] 。維奧拉和瓊斯[2]進而提出了哈爾特徵。哈爾特徵使用檢測窗口中指定位置的相鄰矩形,計算每一個矩形的像素和並取其差值。然後用這些差值來對圖像的子區域進行分類。

例如,當前有一個人臉圖像集合。通過觀察可以發現,眼睛的顏色要比兩頰的深。因此,用於人臉檢測的哈爾特徵是分別放置在眼睛和臉頰的兩個相鄰矩形。這些矩形的位置則通過類似於人臉圖像的外接矩形的檢測窗口進行定義。

維奧拉-瓊斯目標檢測框架的檢測階段,一個與目標物體同樣尺寸的檢測窗口將在輸入圖像上滑動,在圖像的每一個子區域都計算一個哈爾特徵。然後這個差值會與一個預先計算好的閾值進行比較,將目標和非目標區分開來。因為這樣的一個哈爾特徵是一個弱分類器(它的檢測正確率僅僅比隨機猜測強一點點),為了達到一個可信的判斷,就需要一大群這樣的特徵。在維奧拉-瓊斯目標檢測框架中,就會將這些哈爾特徵組合成一個級聯分類器,最終形成一個強分類群

哈爾特徵最主要的優勢是它的計算非常快速。使用一個稱為積分圖的結構,任意尺寸的哈爾特徵可以在常數時間內進行計算。

矩形哈爾特徵[編輯]

維奧拉和瓊斯的部分特徵

一個矩形哈爾特徵可以定義為矩形中幾個區域的像素和的差值,可以具有任意的位置和尺寸。這種特質也被稱為2矩形特徵(2-rectangle feature)。 維奧拉和瓊斯也定義了3矩形特徵和4矩形特徵。這個值表明了圖像的特定區域的某些特性。每一個特徵可以描述圖像上特定特性的存在或不存在,比如邊緣或者紋理的變化。例如,一個2-矩形特徵可以表明一個邊界位於一個亮區域和一個暗區域之間。

哈爾特徵的快速計算[編輯]

計算矩形陰影部分的像素和

維奧拉和瓊斯的一個重要貢獻是使用積分圖[3] 。 積分圖是一個二維矩形的查找表,與原始圖像具有一樣的尺寸。積分圖的每一個元素是原始圖像在對應位置左上角所有像素的和。這就使得在任意位置計算任意尺寸的矩形的像素和時,只需要進行四次查表:

其中點 屬於原始圖像 ,如圖所示。

每個哈爾特徵的查找次數取決於它的定義。維奧拉和瓊斯的2矩形特徵需要六次查詢,3矩形需要八次,而4矩形則需要九次。

傾斜的哈爾特徵[編輯]

蘭哈切和梅迪[4] 提出了傾斜的(45°)哈爾特徵。這種對特徵維度的擴充是為了提升對物體的檢測。由於這些特徵對一些物體的描述更為適合,這種擴充是有效的。例如,一個傾斜的特徵可以描述一個傾斜45°的邊緣。針對這種特徵的計算,也提出了傾斜的積分圖。

參考文獻[編輯]

  1. ^ Papageorgiou, Oren and Poggio, "A general framework for object detection", International Conference on Computer Vision, 1998.
  2. ^ Viola and Jones, "Rapid object detection using a boosted cascade of simple features", Computer Vision and Pattern Recognition, 2001
  3. ^ Crow, F, "Summed-area tables for texture mapping", in Proceedings of SIGGRAPH, 18(3):207–212, 1984
  4. ^ Lienhart, R. and Maydt, J., "An extended set of Haar-like features for rapid object detection", ICIP02, pp. I: 900–903, 2002