摘 要:研究基于支持向量機的人臉識別技術。在識別過程中,首先將人臉圖片分為子圖片,再利用離散小波變換提取子圖片特征組合為多維向量作為整幅人臉圖片特征。在此基礎上,為每個類構造一個支持向量機進行識別。基于ORL人臉數據庫的模擬實驗表明,算法實現較簡單,并具有較好的性能。
關鍵詞:人臉識別;支持向量機;離散小波變換
中圖分類號:TP391 文獻標識碼:A
1 引言
人臉識別是一種典型的模式識別應用,在許多領域中有著廣泛的應用,特別是在安全領域的應用得到了研究人員的極大注意。但在如在機場、車站、商場等人流量巨大的情況下,如何快速定位人臉區域并進行識別是一件非常困難的任務,此外,采集的人臉圖像隨外界條件的變化而具有很大的不同,這也進一步增加了自動識別所面臨的困難。

進行人臉識別和一般模式識別一樣可以分為兩個關鍵部分:特征提取和識別過程。利用特征提取可以降低原始圖像的維度,簡化識別過程,針對人臉識別,研究人員提出了許多的特征提取算法,如:主成分分析法PCA、獨立成分分析法ICA等。但基于整幅圖像的變換需要較為復雜的操作,并不簡單。基于提取的特征,分類器的選擇也得到了許多研究人員的關注,并設計了許多有效的分類器,如:人工神經網絡等。作為一種基于統計學習理論的新型分類器,支持向量機在許多領域的應用,如文本分類、圖象分類等,中表現出了良好的性能,得到了研究人員的廣泛關注。
基于相關文獻的研究,本文將支持向量機應用于人臉識別,在進行特征提取時提出了一種利用離散小波變換進行人臉特征提取的算法,在設計分類器時為每個人臉模式訓練一個支持向量機。在進行人臉特征提取時,先將人臉圖像分割為子圖片,對每個子圖片進行二維離散小波變換,然后將最低頻段的小波系數提取出來進行處理得到一個表示該子圖的一維特征,然后將其組合為表示整幅人臉的n維特征向量。基于ORL人臉數據庫的模擬實驗表明,算法實現簡單,并具有較高的識別率。
2 支持向量機
支持向量機(Support Vector Machines,SVM)是由Vapnik基于統計學習理論提出的一種結構風險最小化機器學習技術,其基本思想是,對于一個給定的具有有限數量訓練樣本的學習任務,在準確性(對于給定訓練集)和機器容量(機器可無錯誤地學習任意訓練集的能力)進行折衷,得到最佳的推廣性能。

設給定的訓練集為{(xi,yi)l i=1…l,x∈Rn,y∈{-1,+1}},且可被一個超平面線性分割,記該超平面為(w*x)+6=0。如果一個訓練集中的矢量能被一個超平面無錯誤地線性分割,且距該超平面最近的矢量之間的距離最大(又稱為間隔(Margin)最大),則稱該超平面為最佳超平面,其中距離超平面最近,并對決策面設計起作用的點被稱為支持矢量(Support Vector)。在線性可分情形下,可以將構造最佳超平面的問題轉化為求φ(叫)=‖w‖2的最小值的問題。可以計算支持矢量間的間隔為2/‖w‖。任一點x距離超平面的距離為(‖w*x+6 /‖w‖),而具有最大間隔的最佳超平面需要滿足:規范超平面子集的VC維數滿足h<=min([R2,A2],n)+1,其中:n為矢量空間的維數,所有待分割的矢量位于半徑為R的超球內,而‖w‖≤A。可以將構建最佳超平面分割兩類的問題,轉化為解決二次規劃問題,即在yi(w*xi+b)>=1(i=1,…,l)下,求(w*w)1/2的最小值。
此外,Vapnik又進一步提出了支持矢量機的概念將線性推廣到非線性,其基本思想是:通過事先確定的非線性映射將輸入矢量x映射到一個高維的特征空間(Hilbert空間)中,然后在此高維特征空間中構建最佳超平面。
3 人臉識別過程
基于支持向量機的人臉識別包括如下幾個部分:人臉特征提取;支持向量機訓練階段和識別階段。其中,人臉特征提取將基于子圖分割的思想,先將圖象分成子圖,如圖1所示,然后利用二維離散余弦變換對每個子圖進行處理,提取最低頻的系數,然后將系數處理為一個量作為該子圖的特征,按照圖1的方式,將其組合在一起構成一個表示整幅人臉圖像的特征。在支持向量機訓練階段將為每種人臉模式訓練一個支持向量機,最后將其應用到整個數據庫中進行識別。

3.1 二維離散小波變換
假設φ(x)是一個一維的尺度函數,ψ(x)是相應的小波函數,那么可以得到一個二維小波變換的基礎函數如下:
ψ1(x,y)=φ(x)ψ(y)
ψ2(x,y)=ψ(x)φ(y)
ψ3(x,y)=ψ(x)ψ(y)
我們可以將圖像當作二維矩陣進行處理。設圖像矩陣的大小為N×N并且N為偶數,經過二維離散小波變換后,圖像可以分解為4個部分,每個部分為原圖像尺寸的1/4的子塊頻帶區域,如圖2中上半圖所示。每個子塊中包含了相應頻帶的小波系數,相當于在水平方向和豎直方向上進行隔點采樣。如果進行第二層小波變換,則變換的對象為LL頻帶,如圖2中下半圖所示,即為2層小波變換的系數分布。經過變換后,LL頻帶保持了原始圖像的內容信息即,圖像能量主要集中于此頻帶;HL頻帶保持了圖像水平方向上的高頻邊緣信息;LH頻帶保持了圖像豎直方向上的高頻邊緣信息;HH頻帶保持了圖像對角線方向上的高頻邊緣信息。因此,在本文中,我們選擇最低頻LL頻帶進行處理,經過norm處理后,得到一個量表示此子圖片,然后組合所有的子圖片特征即可得到一個表示整幅圖像的特征向量。
3.2 ORL數據集
ORL人臉數據庫由劍橋大學ATT實驗室創建,包含40人,每人10副圖片,共400張面部圖像。所拍攝的圖片在照明、臉部表情等方面不盡相同,如圖3所示。該人臉庫兼顧了人種、性別、面部表情等方面,是一種常用的進行人臉識別的數據庫。
3.3 性能評價

由于人臉數據庫中包括了40個人,也就是說,在利用支持向量機進行人臉識別時,我們需要訓練40個支持向量機。實驗結果如表一所示,從中可以看出,無需對圖像做復雜處理即可利用支持向量機有效識別不同的人臉,與其他算法相比,支持向量機也具有較好的性能。
4 結論
人臉識別是一個活躍的研究領域,本文采用如下方式提取人臉特征:基于二維離散小波變換,通過對劃分后的子圖進行變換得到最低頻系數,進而提取一維特征表示該子圖,組后所有子圖的特征即可得到表示整幅圖像的特征。基于提取的特征,為每類人臉訓練一個支持向量機用于區別該類人臉和其他類人臉。利用ORL數據庫的實驗表明,基于支持向量機并結合二維離散小波變換能夠有效識別不同的人臉,相比于其他算法,支持向量機也具有較好的性能。