【摘 要】人臉識別是近年來模式識別圖像處理,機器視覺,神經網絡以及認知科學等諸多領域的熱點課題之一,本文主要是基于GPCA(廣義主成分分析方法),對經傳感器采集得到的一系列尺寸相同的人臉圖像進行識別研究以及理論探討。針對常用人臉識別方法的弊端和不易操作性,運用SPAMS 工具包(Sparse Modeling Software toolbox),研究圖像的降維稀疏表示。
【關鍵詞】人臉識別;廣義主成分分析;稀疏表示
1. 引言
隨著安全入口控制和金融貿易方面應用需要的快速增長以及各方面對于快速有效的自動身份驗證的迫切要求,生物統(tǒng)計識別技術得到了新的重視,而人臉識別是所有的生物識別方法中應用最廣泛的技術之一,目前國內外研究也取得了一定的進展, 綜合有關文獻[1][2],目前國外人臉識別的方法主要集中在以下幾個方面:
(1) 模板匹配的方法
(2) 示例學習的方法
(3) 神經網絡的方法
(4) 基于隱馬爾可夫模型的方法
除此以外,基于Ada Boost的人臉識別算法,基于彩色信息的方法,基于形狀分析的方法,以及多模態(tài)信息融合的方法,國外都進行了大量的研究與實驗。
國內的研究工作主要是集中在三大類方法的研究:基于幾何特征的人臉正面自動識別方法、基于代數特征的人臉正面自動識別方法和基于連接機制的人臉正面自動識別方法。
總之,采用人臉識別技術,建立自動人臉識別系統(tǒng),用計算機實現對人臉圖像的自動識別有著廣闊的應用領域和誘人的應用前景。
在上述研究基礎上,本文主要對基于廣義主成分分析的人臉識別算法進行研究,并結合在SPAMS工具包下對圖像進行稀疏處理,其中稀疏表示是特色。主要內容是信號稀疏表示以及matlab稀疏工具包SPAMS的簡要介紹和應用,包括識別過程中所需要的基本圖像處理技術,并闡述在此基礎上和GPCA技術結合的人臉識別算法流程。
2. 基于SPAMS圖像稀疏表示
每個大小為w×h 的圖像可看作M維空間的一個點,M=w×h,同一個面孔的不同亮度和表情被表示到M維空間中的低維線性子空間,稱為臉子空間。
我們定義ni個圖片,向量vi,1,vi,2,…,vi,ni∈Rm并假設這些向量足以包含i系列的臉子空間,任何關于相同目標的新的訓練圖像,即為向量y∈Rm,y可以表示如下:
(1)
其中αi,1是實標量,將所有ni相加得n=n1+n2+…+nk,作為向量A的n列:
(2)
理想的y(關于i)可以用A表示為:
Y=Ax0 ∈Rm (3)
其中:x0=[0, …,0,αi,1, αi,2, …, αi,n,0, …,0] T∈Rn (列向量)。X0是一個系數矩陣,其元素幾乎是0,處理與i系列有關系的元素。我們得出如下簡單的意見:一個有效地測試圖像可以只用有相同變量的測試圖像群充分表示出。如果變量的數目k大得合理,表示是自然稀疏的。
x0是一個系數矩陣,其元素幾乎是0,處理與i系列有關系的元素。我們得出如下簡單的意見:一個有效地測試圖像可以只用有相同變量的測試圖像群充分表示出。如果變量的數目k大得合理,表示是自然稀疏的。
如果system3(under-determined)(m (P2)min subject to y=Ax (4) 這里是范數的符號。 類似的,如果system3(over-determined)(m>n),通常通過最小化找到最小二乘法解決辦法。然而,這種方法不能定位識別問題中的如下兩種重要性質。 1)數據維數很高。 2)理想的解答是稀疏的:x0中非0元素所占比例只是。 為了解決上面的問題,我們尋找的方法能夠:(1)使維數m降低到d 且d≤m ;(2)明確計算y在低維空間中的稀疏矩陣表示。如果這兩個目標都能完成,我們將會看到適當的加強稀疏可以使結果更少地依賴于維數低的細節(jié)(過程)。 在數據庫里,大維數縮減方法常被用于映射高維人臉圖像到低維特征空間,已有一類方法能提取所有面部特征,例如特征臉方法,費舍爾臉方法等,從圖像空間到特征空間的映射可以表示為:矩陣,d≤m。將等式(3)兩邊同乘以R可得: (5) 映射后,特征空間的維數d通常比n小。因此,等式(5)所表示的系統(tǒng)是under-determined,x的解也不是唯一的。然而,理想中的x0應該是稀疏的,在不嚴格的條件下,系統(tǒng)的方程的最稀疏解確實是唯一的。也就是說,理想中的x0是如下最優(yōu)化問題的唯一解: (P0) min subject to (6) 解決(P0)是NP-hard ,而且很難通過多項式時間算法去近似求解。在通常情況下,無疑通過程序來尋找最稀疏解比費力的找x中元素的所有子集有效。 壓縮傳感理論的最近發(fā)展揭示了如果解x0是充分稀疏的,相關的(P0)問題等價于求一下的L1最小化問題: (P1) min subject to (7) 這個問題能通過標準線性多項式時間程序或者二次多項式程序方法來解決。如果已知道解是很稀疏的,那么更有效的方法也是可考的。 3.GPCA人臉識別算法 傳統(tǒng)的廣義主成分分析法一般不包含稀疏表示部分,不適用SPAMS工具包,具體識別流程如圖2所示。 本文通過改進,采用廣義主成分分析方法,并結合圖像的稀疏表示,使用SPAMS工具包,具體的流程設計如圖3所示: 對各個部分介紹如下: (1)人臉圖像采集:基于CMOS圖像傳感器成本低、功耗低、 單一工作電壓、集成 AD 轉換器、數字形式數據輸出、圖像大可編程控制等優(yōu)點,可以使用CMOS圖像傳感器,如MT9T001 CMOS圖像傳感器。這里由于軟硬件條件限制,直接使用yale人臉庫中的標準圖像。 (2)讀取圖像數據:直接調用matlab里面imread函數,將圖像以矩陣的形式體現出來,我們知道,通常通過傳感器采集到的圖像是彩色的,彩色有三種基色組成,red,green,blue;graycolor = (Red + Green + Blue) / 3,簡稱RGB,彩色圖像是三維的,可以通過簡單的行列操作得到一維(一種基色下的)圖像,再進行相關的處理。如果圖片的尺寸過于大,可以用imresize函數進行調整。這里將訓練集的圖像矩陣信息降維到一個矩陣里面,每一列代表一個圖像信息。 (3)特征臉定位:每個人臉圖像有個特征矩陣代表它的信息,同理也可以通過矩陣處理得出均值臉圖像。這里可以通過每個圖像矩陣減去特征矩陣得到特征矩陣A(但不能完整表達出一幅圖像),根據廣義主成分分析理論,求出AAT的特征向量就能表達出圖像信息,當然這中間包括一些細節(jié)操作,如規(guī)范化等等。若想得出特征臉圖像可以通過imshow函數來畫。 (4)SPAMS工具包L1范數最小化求解:調用SPAMS中的mexOMP函數來求解L1范數最小化問題。這里調用的格式是A=mexOMP(y,S,param); y是測試圖像矩陣,S是訓練集圖像矩陣,param對應下面的γ,得出的矩陣A是稀疏解,這里S是已經經過規(guī)范化處理之后的矩陣,每一個測試圖像對應一個稀疏解,故所有的測試圖像可以以解集{A1,A2,…,Ai}的形式代表出來,達到了降維的目的,使計算量減少了很多。 (5)重構圖像及對比:這里可以通過y=AS來恢復測試圖像,當然過程中會涉及矩陣的反規(guī)范化處理,以正確求解。同樣可以將原始圖像和重構圖像在matlab中畫出,以便對比分析。這里面圖像的恢復程度依賴于γ的取值,直接調用的mexOMP函數,param的取值也依賴于它的形式規(guī)定和讀者自己設定。 (6)識別率計算:文獻中給出傳統(tǒng)的識別判別方法是NS和NN方法,NS分類法:如果y到子空間(包括主體i的所有圖片)的距離就把測試圖片y分配給主體i: 。 NN分類法:如果y和主體i的最近測試圖片的距離滿足 ,是所有主體中最小的,就把測試圖片y分配給主體i。 4.小結 本文對于目前的熱門課題人臉識別進行研究,采用的是廣義主成分分析方法,且對SPAMS工具包進行了簡單的介紹和應用。 信號稀疏表示的優(yōu)點在于能夠利用幾個較大的稀疏系數來逼近原信號,這也就是它們被稱為稀疏信號表示理論的原因,后續(xù)我們還要繼續(xù)研究基于SPAMS工具包,與傳統(tǒng)方法進行了對比。 參考文獻 [1] 田原.吳更石.梁德群. 計算機人臉識別的研究現狀與進展 [J],無線電工程,1997年03期. [2] 鄧興波.高強.任德學. 基于TMS320DM642的CMOS圖像采集系統(tǒng)的設計 [J],天津理工大學學報,2008, 24(1), 35-38. [3] 李武軍. 王崇駿.張煒.陳世福. 人臉識別研究綜述 [J],萬方數據 2006年第19卷第1期. [4] 侯鯤 賈隆嘉 王赫寧. 人臉識別技術的現狀和發(fā)展趨勢 [J],科協(xié)論壇.2010年第11期. [5] 袁燕. 人臉識別研究綜述 [J],電腦知識與技術,2007(17). [6] 程文波.王華軍. 信號稀疏表示的研究及應用 [J].西南石油大學學報,2008年 第30卷 第5期. [7] 雷松澤. 基于主元分析的人臉特征提取的matlab實現 [J],電腦開發(fā)與應用,2006年11期. [8] 廖海斌.郝寧波.陳慶虎. 基于奇異值與稀疏表示的穩(wěn)健性人臉識別 [J],萬方數據,2010,34(7).