許小媛
XU Xiao-yuan
(江蘇廣播電視大學,南京 210036)
基于特征抽取和多分類器組合的人臉識別方法
Based on feature extraction and the combination of multiple classifiers face recognition method
許小媛
XU Xiao-yuan
(江蘇廣播電視大學,南京 210036)
人臉識別技術有著廣泛的應用領域,多分類器組合是提高識別效果的一條有效途徑。本文分別利用線性鑒別分析,主成分分析和獨立成分分析得到人臉圖像的有效代數特征,以支持向量機作為人臉的分類器,有效地避開了人臉識別的小樣本局限。由于SVM是用來解決兩類問題的分類方法,采用與二叉決策樹相結合的方法解決了人臉識別的多類問題。最后結合多分類器組合的方法對人臉圖像進行識別。該方法在ORL人臉數據庫上進行識別,取得了優異的識別效果,并且對人臉的姿態,表情有一定的不敏感性。
特征提取;人臉識別;支持向量機;多分類器組合
人臉識別是生物識別技術的重要課題,目前是一個非常活躍的研究方向。進入九十年代以來,人臉識別的研究重新成為人們所關注的熱點,在心理學、神經科學、模式識別和計算機視覺等方面涌現出大量的成果。人臉正面圖象包含了人臉更明顯的特征,其識別研究受到人們更多的重視。將一幅人臉圖象看成一個矩陣,通過作矩陣變換,可以抽取人臉的全局識別特征。人臉識別問題是個典型的小樣本識別問題,基于統計學的模式識別方法有一個最基本的應用前提,就是只有在學習樣本的數目趨于無窮大時,其識別的性能才能有理論上的保證,這也是與統計學的漸進學習理論是一致的 如何解決人臉識別上的小樣本局限就成為這一領域學者的研究重點。從20世紀60年代開始,V.N.Vapnik等人在有限樣本的機器學習問題上取得一系列的進展,在這一研究領域建立了一套較完整的理論體系――支持向量機[1-2](Support Vector Machine, SVM)。目前,這一新的理論方法在解決模式識別中小樣本、非線性及高維識別問題中表現出獨特的優勢和良好的應用前景。由于SVM是用來解決兩類樣本之間的分類問題,對于多類問題,SVM采用的是一對一和一對多分步解決的策略。在本文的人臉分類中,對于多類的人臉分類,采用SVM的一對一方法結合二叉決策樹對單特征的人臉進行分類,最后采用多分類器組合方法取得了更高的識別率。




其中的W一般稱為分離矩陣。
PCA實質上是KL變換的網絡遞推實現。KL變換是圖象壓縮技術中的一種最優正交變換,其生成矩陣一般為訓練樣本的總體散布矩陣。其思想就是將包含人臉的圖象區域看作是一種隨機向量,因此可以采用KL變換獲得正交KL基。對應其中較大特征值的基具有與人臉相似的形狀,因此又稱作特征臉(Eigenface)。利用這些特征向量描述,表達和逼近人臉圖像,因此可以進行人臉的識別與合成。假定在訓練階段數據庫中有K個人,每個人有M幅人臉灰度圖像,其中每一幅圖像都用NxN的二維數組I(x,y)來表示,數組元素表示象素點的灰度值。同樣,每一幅圖象都可以視為一個N2x1的向量。因此,它等同于N2維的人臉象素域空間中的一個點。我們用fij表示。






在式(5)兩邊左乘A,然后與(4)式比較,我們可以很容易的得到:

這些特征向量構成了人臉空間的一個子空間的正交基,這個子空間就是我們通常所說的特征空間。特征空間由訓練圖象的協方差矩陣的特征向量構成。然后,我們將數據庫中的每一幅人臉f從原始人臉空間轉化到特征空間:

支持向量機算法的思想來自于統計學習理論。該算法基于結構風險最小化(structural risk minimization, SRM)原理,將原始數據集合壓縮到支持向量集合,然后用子集學習得到新知識,同時也給出由這些支持向量決定的規則,并且可得到學習錯誤的概率上界,即支持向量的期望數目和訓練集合大小的比值。SVM用于模式識別的基本思想是構造一個超平面作為決策平面的,使兩類模式之間的距離最大。

使分類間隔最大實際上就是對推廣能力的控制,這是SVM的核心思想之一。統計學習理論指出,在N維空間中,設樣本分布在一個半徑為R的超球范圍內,則滿足條件的正則超平面構成的指示函數集為符號函數)的VC維滿足下面的界


概括地說,支持向量機就是首先通過用內積函數定義的非線性變換,將輸人空間變換到一個高維空間,在這個空間中求(廣義)最優分類面。SVM分類函數形式上類似于一個神經網絡,輸出是中間節點的線性組合,每個中間節點對應一個支持向量。
SVM中不同的內積核函數將形成不同的算法,目前研究最多的核函數主要有三類,一是多項式核函數

所得到的是q階多項式分類器;
二是徑向基函數(RBF)

所得分類器與傳統RBF方法的重要區別是,這里每個基函數中心對應一個支持向量,它們及輸出權值都是由算法自動確定的。
三是采用Sigmoid函數作為內積,即

支持向量機是針對兩類問題提出來的,為實現對人臉的多類問題的識別,需要對SVM進行推廣。在一個多類別問題中,如果已知任意兩類可分,則通過一對一或者一對多的組合規則,實現多類劃分。在本文采用一對一結合二叉決策樹的判決規則來實現對人臉數據的多類劃分。

本文采用ORL人臉數據庫驗證該算法,該數據庫包括從1992年4月到1994年4月劍橋大學實驗室拍攝的一系列人臉圖像,具體為40個人,每個人有不同表情或不同視點的10幅圖像所構成,傾斜角度不超過20度,這些人臉圖像的分辨率為92×112,為灰度圖像。
在實驗中,我們采用每類樣本的前六個數據作為訓練樣本,即采用每個人的前六幅照片作為訓練數據,同時所有的人臉數據作為檢測數據,為了數據處理的方便,試驗中的原始數據采用46*56的形式。
在本文的實驗中,首先采用特征提取方法得到人臉圖像的不同特征,由于PCA和ICA的特征提取方法從不同的階數上消除了數據的相關性,在這里我們分別給出了兩種特征提取方法得到的結果。

圖1 原圖(左),特征臉(中),獨立成分臉(右)
對于經過特征提取之后的得到不同代數特征人臉圖像數據,我們采用SVM作為分類器以及組合各個分類器得到的分類效果圖如圖2所示。

圖2 不同分類情況下的分類效果圖
本文通過提取人臉數據的不同代數特征,并采用支持向量機結合多分類器組合方法在一定程度上提高了人臉的識別率。在ORL人臉數據庫上的實驗也驗證了這個方法的有效性,多分類器組合的識別率遠遠優于單分類器的識別率。提取圖像的不同特征,并在此基礎上進行識別是提高圖像識別率的一個有效方法。在不同的特征集上設計最優分類器和采用加權的組合方法是需要我們進一步要做的工作。
[1] VAPNIK V N,張學工譯.統計學習理論的本質[M].清華大學出版社,2000.
[2] 王建芬,曹元大.支持向量機在大類別數分類中的應用[J].北京理工大學學報,21 (2):225-228,2001.
[3] 趙海濤,金忠,楊靜宇.基于最佳鑒別變換和分類器組合的人臉自動識別[J].中國圖象圖形學報,5A(9):769-772,2000.
TH166
B
1009-0134(2010)11(下)-0036-03
10.3969/j.issn.1009-0134.2010.11(下).14
2010-09-23
許小媛(1980 -),女 ,講師,碩士研究生,研究方向為計算機模式識別。