摘 要:光照問題是影響人臉識別性能的重要因素之一,本文提出了一種新的降低光照影響的圖像預處理方法,較好的削弱了光照對人臉識別的影響。在ORL與Yale人臉庫中進行了實驗研究,表明了提出的算法對光照產生的高光、眼鏡等小遮擋物具有較強的魯棒性。另外,針對Yale人臉庫,對本文提出的方法與中值濾波算法和線性平滑濾波算法進行了實驗比較。
關鍵詞:預處理;光照;降噪;人臉識別
1 引言
人臉識別是模式識別領域的重要研究方向,很多學者對該問題進行了大量研究,主要包括人臉檢測、圖像預處理、特征選擇與提取、分類識別等多個方面,并提出了眾多經典算法和解決方案。一般來說,人臉識別過程主要包括以下步驟:輸入圖像、人臉檢測與定位、圖像預處理、人臉特征提取、分類識別等部分。其中圖像預處理是識別過程中一個重要步驟,可以有效的去除或減小光照等外部環境對圖像的影響。我們知道,人臉圖像的采集是非常方便的,但是在采集過程中卻存在很多干擾因素,如距離遠近、焦距等會使人臉的位置和大小不確定,而光照強度變化也會導致圖像的灰度元素分布不均勻,因此,為提高人臉識別系統的性能,需要對人臉圖像進行預處理,包括扶正、歸一化、圖像增強等技術以此降低位置、大小以及光照等所帶來的影響。
實際上,光照問題一直是圖像預處理研究領域中的熱點和難點,能否克服光照變化對人臉識別系統性能具有很大的影響[1]。A.Nabatchian提出的基于最大值濾波的方法,在簡化圖像預處理步驟中做出一定貢獻,但卻不能很好的改善光照對人臉識別的影響[2]。在不同的光照條件下,H.F.Hu.提出了一種離散小波變換(DWT)的光照歸一化人臉識別方法,取得了較好的識別效果[3]。本文針對光照問題進行了研究,提出了一種解決光照問題的方法,并對圖像處理中的線性平滑濾波和中值濾波方法進行比較。
2 線性平滑濾波和中值濾波
2.1 線性平滑濾波
線性濾波也稱為均值濾波,有鄰域平均法、加權均值法等處理方法[4]。利用鄰域平均法的線性平滑濾波基本原理是用某像素領域內的均值代替該像素值。具體方法是對需要處理的當前像素點A(x,y)建立一個大小合適的濾波窗口模板,求模板中所有像素的均值,再把該均值賦予當前像素點。將這個步驟在圖像中遍歷,更替所有像素點的值。可以看到,鄰域的大小與平滑的效果直接相關,鄰域越大平滑的效果越好。但鄰域過大,平滑會使邊緣信息損失越大,從而使輸出的圖像變得模糊,因此需要合理選擇鄰域的大小。
2.2 中值濾波
中值濾波是一種典型的非線性平滑濾波方法,中值濾波的基本原理是把數字圖像或數字序列中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍像素灰度值的差比較大的像素改取與周圍的像素接近的值,從而消除孤立的噪聲點。對于二維圖像進行中值濾波處理時,濾波窗口也是二維的,但這種二維窗口可以有各種不同的形狀,如線狀、方形、圓形、十字形、圓環形等[5]。中值濾波的主要步驟如下:
(1)將模板在圖中漫游,并將模板中心與圖中某個像素位置重合;
(2)讀取模板下對應像素的灰度值;
(3)將這些灰度值從小到大排列,找出位于中間的值;
(4)將中間值賦予對應模板中心位置的像素。
3 一種新的圖像預處理方法
假設圖像為A,其大小為m×n,將該圖像放入x-y坐標系中,令 。以(x0,y0)為原點坐標,圖像水平向右為x軸正方向,垂直向上為y軸正方向,將圖像分布在直角坐標系中,如圖1所示。
可以看到,該圖像的四部分分別位于坐標系中的四個象限,對每一象限中的圖像分別建立窗口,如圖2所示。例如,在第一象限中的圖像內容按照圖2(a)窗口確定像素的灰度,也就是說bi位置的灰度值由(bi+ai)/2確定,通過此方法使得鄰域中遠離原點的像素灰度值趨近于中部某元素的灰度值,從而達到消除噪聲的目的。按照此方法分別在四個象限的圖像中遍歷,進而更替坐標軸外的所有像素點的灰度值。
由以上方法可以知道,該方法和線性平滑濾波具有一定的相似性,但是在鄰域選取和遍歷方式方面并不相同。以第一象限的圖像為例,下面給出該方法的具體描述。
⑴選擇圖2(a)的2×2窗口,讓該窗口的ai點和圓點O(x0,y0)重合。
⑵將bi位置的灰度值由(bi+ai)/2進行替換,然后移動該窗口,直至處理完該象限中的圖像。
其它象限采取方法和上述一致。
對于同一人不同光照情況下的兩幅圖像進行處理,處理前的圖像圖片色差大,處理后的圖片均勻了色差,起到了良好的光照降噪效果。通過該方法處理后的圖像,光照產生的高光點(來自于臉頰、眼睛等處)將有效消除,也會減少一些細節信息,比如不清晰的眼尾和眉尾,但是不會降低有效信息。
4 實驗結果和分析
4.1 本文圖像預處理方法在ORL數據庫上的實驗
使用2DPCA方法對本文提出的方法在ORL人臉庫上進行性能測試,ORL數據庫包含40個人,每人提供10種不同的圖像。這些圖像面部表情和細節有所不同,人臉具有一定的傾斜和旋轉[6]。圖3給出了ORL數據庫中一個人的五幅圖像。
實驗中采用每類圖像樣本的前五張進行訓練,后五張圖像進行測試,分別在未經預處理的圖像庫和經過本文預處理方法處理過的圖像庫中進行人臉識別。
在ORL數據庫中,經本文提出的預處理方法處理后的圖像設為數據庫A,未經預處理的圖像設為數據庫B。實驗結果如圖4所示。由實驗知道,數據庫B中被錯誤分類的圖像經過使用本文提出的預處理方法處理后得到了正確的識別。在圖4的兩組圖像中,待識別圖像和錯誤分類圖像由于光照原因或姿態相似度高而錯誤配對。其中圖(a)中,待識別圖像和錯誤分類圖像不論在發型、臉型、五官等方面都相似。經過圖像預處理后,圖像的主要特征被增強,而次要特征被減弱。在圖(b)中,可以看出該算法對眼鏡這種遮擋物的魯棒性非常好,對鏡框產生的遮擋、鏡片反光產生的高光起到了降噪作用,是否配戴眼鏡并不影響識別效果。實際上,該預處理方法對由于眼睛眼白部分產生的白色區域也有很好的處理效果。
另外,在數據庫A和數據庫B中,分別使用每類圖像樣本的4至9個圖像作為訓練樣本,使用2DPCA方法進行人臉識別,實驗結果如圖5所示。可以看到,當每類的訓練樣本取4個以上時(2DPCA方法的特征向量數目取10),經本文預處理的圖像識別率高于未處理的圖像識別率。
4.2 本文預處理方法在Yale數據庫上識別效果比較
為了進一步驗證提出的預處理方法的有效性,對本文預處理方法和線性平滑濾波、中值濾波在Yale數據庫上進行實驗比較。實驗中采用每組前5個圖像為訓練樣本,剩下6個圖像作為測試樣本,采用2DPCA 和最近鄰分類器進行識別。實驗結果如表1所示,可以看到,在2DPCA做為識別算法時,在Yale數據庫中本文提出方法的識別率明顯高于中值濾波和線性平滑濾波。
表1 不同預處理方法在Yale數據庫中的識別效果
預處理算法訓練樣本個數(5幅)
無88.89
中值濾波90.00
線性平滑濾波90.00
圖像退化去噪預處理方法100.00
5 結論
本文提出了一種新的基于圖像降噪的預處理方法,算法對光照產生的高光和小面積陰影、斑點、眼鏡框等有有效地去除效果,同時也能夠反映不同人之間的特征區別。算法在ORL、Yale人臉庫上的實驗中提高了識別率,在Yale的對比試驗中,比中值濾波算法和線性平滑濾波算法的實驗效果要好。
本文雖然在人臉識別預處理方法上做了一些嘗試性的研究,但是算法還是存在許多實際應用問題。在人臉識別中有很多問題有待解決,隨著人臉識別技術的發展,可以結合新提出的算法進一步研究,完善現有方法。
[參考文獻]
[1]盧春梅,牛海軍,郝琳波.消除光照和姿態變化影響的人臉識別[J].計算機工程與應用,2008(10).
[2]A.Nabatchian,E.Abdel-Raheem,M.Ahmadi.Illumination invariant feature extraction and mutual-information-based local matching for face recognition under illumination variation and occlusion[J].Pattern Recognition,2011,44(10-11):2576—2587.
[3]H.F. Hu.Variable lighting face recognition using discrete wavelet transform[J].Pattern Recognition Letters,2011,32(13):1526-1534.
[4]宋召青,鄭蘇,李志成.基于平滑濾波與最小二乘支持向量機的人臉圖像識別研究[J].Proceedings of 29th Chinese Control Conference,2010,July 29-31.
[5]李登輝,徐亞寧,王巖紅.人臉識別中圖像預處理方法的研究[J].大眾科技,2011(4):65-66.
[6]趙麗,馬銀雪.基于Fisher判別的人臉識別方法研究[J].電子設計工程,2012(24).