龐珊珊 熊建設
摘要:人臉識別是人工智能領域的一個研究熱點,是一種基于信息處理的模式識別。這篇論文簡要介紹了人臉識別技術的特點、研究背景和識別系統的構成,重點介紹了幾種在人臉識別中常用的算法及其評價。總結了現存的研究困難,對人臉識別技術未來的發展和應用做出了展望。
關鍵字:人臉識別;特征提取;特征臉;神經網絡
1 引言
生物特征鑒別技術是利用人體生物特征進行身份認證的一種技術,具有安全可靠、特征唯一、不易偽造、不可竊取等優點。在不同的生物識別方法中,人臉識別有其自身特殊的優勢,例如,非侵擾性;采集設備簡單,使用快捷;通過人臉識別身份符合人類的習慣,正是由于這些良好的特性,人臉識別的相關研究越來越受到人們的重視,并取得了很好的成果。隨著人臉識別技術的飛速發展,它被越來越多的應用于海關監控、企業安全與管理、刑偵等領域。
人臉識別按照信息的來源可以分為兩類:基于靜態人臉識別和基于動態的信息識別。對于動態識別研究的相關技術還比較欠缺,本文只對靜態人臉識別的相關算法進行闡述。
靜態人臉識別系統主要有三個步驟:人臉的檢測和定位、人臉的特征提取和人臉識別,在這些步驟之前還應有預處理這一步,即對采集到的圖像先進行預處理,以達到位置校準和灰度歸一的目的,然后尋找人臉,如果有則確定人臉的位置并提取人臉,然后提取人臉特征,最后根據提取的特征進行識別。下面對人臉識別中的常用算法進行介紹。
2 幾種常用的算法
2.1 基于幾何特征的人臉識別算法
這類識別方法將人臉用一個幾何特征矢量來表示,用模式識別中的層次聚類的思想設計分類器達到識別目的,常采用的幾何特征有眼睛、鼻子、眉毛、嘴等重要的局部特征,臉型特征及五官在臉上分布的幾何特征。識別所用的幾何特征是以人臉器官的形狀和幾何關系為基礎的特征矢量,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等等。在這種基于幾何特征的識別中,不同特征的相似性度量主要依賴于特征矢量的匹配情況進行判決,例如,基于歐氏距離的判決。
基于幾何特征的識別方法的優點有:符合人類的習慣,易于理解;對光照變化不是很敏感,具有一定的抗干擾能力。存在的問題:從圖像中抽取穩定的特征比較困難,當有遮擋時會出現誤提取;當面部表情變化很大,或者姿態變化很大時,魯棒性較差;幾何特征模型的準則過于簡單,一般的幾何特征只描述了器官的基本形狀與結構關系,忽略了細節特征,會使部分信息丟失。
2.2 基于特征子空間(特征臉)的人臉識別算法
特征臉方法是人臉識別技術中的一種典型方法,又稱為主成分分析法(PCA)。SIROV ICH和KIRBY 首先采用PCA算法來表示人臉。它根據一組人臉訓練樣本構造主特征向量空間,即特征子空間(特征臉),這些特征向量是由圖像的生成矩陣的主特征值所對應的特征向量組成,這些主特征向量所占的能量是總能量的90%(一般取這個數)以上,其余的小能量向量被剔除。生成矩陣可以是圖像的協方差矩陣、總類內離散度矩陣等等。這個子空間是降維的,維數比原數據空間要小得多,任何一幅待識別人臉圖像都可以向此特征空間投影并獲得一組坐標系數,這組系數表明了該圖像在子空間中的位置,從而可以作為人臉識別的依據。任何一幅人臉圖像都可以表示為這組特征向量的線性組合,其加權系數(圖像向空間投影得到的系數)稱為該圖像的代數特征。識別的時候,將待識別的圖像投影到這個特征子空間,將得到的投影系數與各個已知人臉圖像的系數進行比較,通過一定的準則,例如k-近鄰法,取未知樣本的k個近鄰,看這k個近鄰中多數屬于哪一類,就把待識別的圖像歸入哪一類。特征臉方法比較簡單易懂,得到了廣泛的使用,但單獨使用的計算量較大,所以PCA經常與其它方法配合使用,例如小波變換與PCA的結合 ,使PCA的降維效果得到改善。
2.3 基于模板匹配的人臉識別算法
模板匹配有靜態匹配和彈性匹配兩種,首先介紹一下靜態匹配。靜態模板匹配方法:設計一個庫,其中存儲了已知人臉的若干模板,這些模板可以是整張人臉的灰度圖像,可以是各生理特征區域的灰度圖像,還可以是經某種變換的人臉圖像。待識別的圖像經過相同的變換后,還要進行尺度歸一化和灰度歸一化的處理,得到與庫中的圖像大小、取向和光照條件均相同的圖像。然后計算待識別圖像和庫中圖像的匹配度,與哪一類的匹配度最好,就將待識別圖像判為哪一類。靜態模板匹配存在的問題:因為庫是固定的,如果人臉表情變化較大,或者有新的模式出現,那么這個模板就不適用了,也就是說靜態模板匹配方法不靈活。考慮這個問題,下面提出彈性模板匹配。
彈性模板匹配是根據待測人臉特征的先驗知識,定義一個特征參數模型,這些參數反映相對應特征形狀的可變部分,為了得到這組參數,根據圖像的邊緣、峰值、谷值和強度信息及特征形狀的先驗知識設計合適的能量函數。我們要求的參數就是使能量函數取極小值時的參數。這種算法的優點是顯然的,它比靜態模板匹配法要靈活,魯棒性要強一些,但是也有缺點:對參數的初值依賴度高,容易陷入局部最小;計算時間長。
2.4 基于神經網絡的人臉識別算法
人工神經網絡是在生物神經網絡的基礎上發展起來的,心理學家McCulloch和數學家Pitts 合作提出了形式神經元的數學模型,成為人工神經網絡的開端。神經網絡方法在人臉識別上比其他類型的方法有其獨特的優勢,它避免了復雜的特征提取工作,可以通過學習獲得其它方法難以得到的關于人臉識別的規律和規則的隱性表達。
神經網絡是以并行方式處理信息,存儲方式是分布式的,如果能用硬件實現,那么將能顯著提高速度。神經網絡把模型的統計特征隱含在神經網絡的結構和參數中,對于人臉這類復雜的、難以顯示描述的模型,基于神經網絡的方法具有獨特優勢。神經網絡的魯棒性比較好,但是訓練慢,并可能陷入局部最優。
2.5 基于隱馬爾科夫模型的人臉識別算法
隱馬爾科夫模型是一種參數表示的、用于描述隨機過程統計特性的概率模型。最早由Samaria 提出了關于人臉的隱馬爾科夫模型。隱馬爾科夫過程是一個雙重的隨機過程:一個潛在的過程稱為“狀態”過程,另一個可觀測過程稱為“觀測序列”,觀測序列是由隱含的狀態過程決定的。
用HMM進行人臉識別,既考慮了各器官的不同特征,又考慮了相互關聯,該模型的參數能較好的表征具體的人臉模型。HMM方法的魯棒性較好,對表情、姿態變化不太敏感。
以上介紹了5中人臉識別中的常用算法,除此之外,還有其他的一些算法,比如,基于彈性圖匹配的算法,基于SVM的人臉識別算法,遺傳算法等等。
3 總結與展望
以上介紹了幾種常用的人臉識別算法,從分析中可以看出,每種方法都有其優缺點,因此根據這些方法的特點,將這些方法結合起來使用,例如Nefian提出了基于2D-DCT的HMM方法。但是由于人臉識別是一項跨學科的研究課題,在研究過程中面臨著相當程度的難度,由于人臉易受表情、光線和附著物等的影響,在研究過程中有一些的困難,具有一定的挑戰性。前面介紹的算法只是在一定程度上解決了一些問題,應用方面還有待進一步提高。
盡管如此,人臉識別技術在經過這么多年的發展后,取得的成績是不可抹殺的,人們提出了很多新的方法,Paul和Michael J.Jones提出基于haar特征的算法 ,采用級聯的boosted分類器進行分類,速度較以往的分類器提高了15倍,識別分類效果很好。
近年來,由于反恐、國土安全和社會安全的需要,世界上各個國家都對安防領域加大了投入。而身份驗證是安防的一個核心領域,在這種大環境下,生物特征識別將迎來一個快速發展的時期,從而人臉識別技術的應用會得到快速發展。
參考文獻
[1]尹飛,馮大政.基于PCA算法的人臉識別[J].計算機技術與發展,2008,18(10):31-33.
[2]楊紹華.一種基于小波變換和PCA的人臉識別改進方法[J].吉林工程技術師范學院學報,2008,24(9):62-65.
[3]邊肇祺,張學工.模式識別[M].北京:清華大學出版社,2000.
[4]Samaria F.Yong S.HHM based architecture for face identification[J].Image and Computer Vision,1994(12):537-583.
[5]Paul Viola, Michael J.Jones. Pobust Peal-time Object Detection[J].Cambridge Research Laboratory, 2001.
作者簡介:龐珊珊(1984-),女,碩士研究生,研究方向:模式識別,圖像處理;熊建設,副教授,研究生導師。