何昌煜
摘要:人臉識別主要是在進行身份的認證,視覺方面的監控和人機接口等各個方面有著非常廣泛的應運,因此也就成為了當前識別計算機視覺領域方面相對熱門的一個研究課題。人臉識別其中包含了對圖像的處理,進行模式的識別,神經網絡的檢測,計算機產生的視覺以及生理學等許多不同科學領域,本文主要是對WATLAB類型的人臉識別環境進行了相應的設計以及實現了一個基于Fisherface的人臉識別算法系統。論述了系統在實現人臉識別時如何進行打開,保存,另存等一些操作功能。
關鍵詞:人臉識別;Fisherface
Fisherface最初是由Ronald Fisher發明的,想必這就Fisherface名字由來。Fisherface所基于的LDA(Linear Discriminant Analysis,線性判別分析,理論和特征臉部用到的PCA有相似之處,都是對原有數據進行整體降維進而映射到低維空間的方法,LDA和PCA都是從數據整體入手而不同于LBP提取局部紋理特征。如果閱讀本文有難度,可以考慮自學斯坦福公開課機器學習或者補充線代等數學知識。
一、基于幾何特征的方法
人臉基本上是由眼睛、鼻子、嘴巴、下巴等各個部位相互構成,正是因為這些特征明顯的部件,在它的形狀、大小以及結構上存在著各種各樣差異性才會使這個世界上每個人的臉部特征千差萬別,因此對這些臉部件不同的形狀和組成結構之間的關系進行幾何的描述,就可以做為在人臉識別上進行辨別的一個重要特征。
通過采用幾何方面存在的特征進行人臉面部識別,一般是通過提取面部的眼、口、鼻等一些比較明顯的特征,因為鼻子和眼睛等幾個明顯的器官,它的幾何形狀,是可以作為進行人臉分類的明顯特征,但Roder在對人臉的幾何特征進行提取的時候,對其中的精確性進行了不同的實驗性的科學研究,最終得出的結果并不是很樂觀。
在可變形的一些模板法中可以視人臉為幾何特征方法上的一種不斷改進,其中含有的基本思想則是 :在進行設計參數的時候,是可以調整一些器官模型的,這就可以將此定義為一個能量函數,在通過不斷地調整模型中的參數,進而使能量函數它的數值達到最小化,此時的這種模型參數,他是可以做為該人臉識別器官的基本幾何特征的。
雖然這種方法它的思想很好,但是也存在兩個非常明顯的問題,一是在能量函數中,各種不同代價它的加權系數只能通過長期的經驗來進行確定,是難以進行深入的推廣的,二是在能量函數進行優化的過程中是十分消耗時間的,也難在實際中進行應用。同時就可以適當的采用一般得幾何特征來描述了人臉部件的基本形狀與組成結構之間的關系,進而也就忽略了臉部在局部一些比較細微的特征,從而也就造成了臉部部分信息出現了丟失的情況,這也更適合做相對較粗的視覺分類,而且在目前階段已有的臉部特征通過檢測技術上的精確,還遠不能滿足精確識別的要求,況且計算量也是非常的大的。
二、局部特征分析方法
在主元子的空間當中它表示的是緊湊,而且臉部特征的維數會有大大降低的情況,但它是確實非局部化的,其中函數的一些支集在進行擴展到整個的坐標空間當中,同時它的形狀是非拓撲的,是由某個軸在投影之后,在最臨近的一個點與原圖像在空間中點幾乎是臨近性,也是沒有任何關系,而臉部的局部性和拓撲性對整個模式的分析和分割是一個比較理想的變化特性,似乎這特征更加的符合在神經信息上進行處理的特征機制,因此也就要尋找出具有這種明顯特性的表達就表現的十分的重要。基于這種想法進行考慮,Atick在此就提出了一種基于局部特征的進行人臉特征適當的提取與識別的新方法。而這種方法在實際生活的應用當中取得了非常好的效果,它也是構成FaceIt人臉識別的一個基礎。
三、神經網絡方法
人工神經網絡則是一種有非線性的動力學組成的一個系統,它具有非常良好的自動組織以及良好的適應能力。在目前階段神經網絡的方法在大部分的人臉識別中的研究已經是方興未艾。因此Valentin就提出了一種新方法,首先提取在人臉部具有代表性的 50個主元,然后利用自相關神經網絡將它逐漸的映射到有 5維的空間當中,再用一個比較普通的含有多層感知的儀器進行不同面部的判別,而且測試圖像效果較好;同時Intrator等也提出了一種新型的混合型神經網絡來對人臉進行進一步的識別,這其中就有非監督神經網絡可以用來進行特征提取,而在監督的神經網絡當中用于一般情況下的分類。當Lee等將人臉的一些明顯特點用六條規則來進行詳細描述,然后在根據這六條規則繼續進行五官的準確定位,可以將五官之間人臉的幾何距離,重新的輸入到模糊的神經網絡中在進行人臉的識別,而且效果還比一般的是基于歐氏距離的方法上在做進一步的較大改善措施,可是Laurence等采用了卷積神經網絡的方法來進行人臉部分識別判斷,由于在卷積的神經網絡中,集成了非常相鄰的人臉像素之間的相關性的臉部知識,從而在一定的程度上,獲得了在圖像中進行平移、旋轉變換和局部人臉變形當中的不變性,因此,也在此得到了非常理想的人臉識別結果,可是Lin等提出了在基于相對概率決策上的一些神經網絡方法 (PDBNN),其主要包含的主流思想,則是采用了比較虛擬 的樣本來進行相對的強化和反強化的學習特征,從而就可以得到較為理想的識別概率人臉估計的結果,并且采用了模塊化的面部網絡結構 進而也可以加快在網絡系統中的學習。這種方法在進行人臉檢測以及準確的人臉定位,人臉面部識別上具有的各個步驟上都很好的得到了廣泛的應用,而其它的研究還有一些 :如Dai等相應的提出了用Hopfield的網絡進行相對低分辨率的人臉聯想面部識別,而Gutta等相對的提出了將RBF與面部樹型進行分類器的適當結合起來,在進行人臉識別的相互混合以及分類器的模型。
四、結語
一般的神經網絡方法在進行人臉識別上的一些應用相對的比起前面講述的幾類方法之間是有一定的明顯優勢的,因為在對人臉進行識別的許多規律當中或者是有規則的進行較為顯性的描述,在現階段是相當困難的,而神經網絡辨別的方法則是可以通過不斷地學習進而來獲得,對這些識別規律和規則判斷中所含隱性表達, 當然在人臉識別以及其他類型的模式領域當中,面部特征提取是一個非常有意義的研究課題。
參考文獻
[1]丁嶸,蘇光大,林行剛,特征臉和彈性匹配人臉識別算法的比較[J].計算機工程與應用,XX,38(7):1-2.