李學龍
【摘 要】人工智能作為一門多種學科互相滲透而發展起來的交叉學科在各方面都有著應用。人臉識別通過知識表示、知識推理、模糊邏輯、神經網絡、專家控制、遺傳算法和群集智能等人工智能方法達到識別人物臉部特征的目的,進而對其進行判定。本文總結介紹了基于幾何特征、基于模型、基于統計以及基于神經網絡等具體識別方法。
【關鍵詞】人工智能;人臉識別;神經網絡
1 人工智能簡介
人工智能(Aritificial Intelligence,AI)是一門綜合了計算機科學、控制論、信息論、神經生理學、心理學、語言學、哲學等多種學科互相滲透而發展起來的一門交叉學科[1],從誕生至今已有近60年的歷史。人工智能是研究如何制造智能機器或智能系統,來模擬人類智能活動的能力,以延伸人們智能的科學[2]。人工智能不在乎計算機是依靠某種算法還是真正理解人類行為,只需要其能表現出與人相似的行為,它是計算機科學中的—個分支,涉及智能機器的研究、設計和應用。人工智能的研究目標在于怎樣用計算機來模仿和執行人腦的某些功能,并開發相關的技術以及產品,建立有關的理論。人工智能可分為:基本人工智能,包括知識表示、推理;高級人工智能,如模糊邏輯、神經網絡、專家控制;計算智能,如遺傳算法、群集智能。人工智能研究領域的三種主要觀點[3]:符號主義又稱為邏輯主義或計算機學派,其認為符號是人類的認識基元,同時人認識的過程即是對符號的計算與推理的過程;聯結主義又被叫做仿生學派,其主要原理是人類的智能是由人腦的生理結構和工作模式所決定;行為主義又被稱作進化主義、控制論學派,其主要原理是智能取決于感知和行動,它不需要知識、也不需要知識的表示與推理[4]。
2 人臉識別
人臉識別是指對輸入的人臉圖像或者視頻,判斷其中是否存在人臉,如果存在人臉,則進一步給出每張人臉的位置、大小和各個主要面部器官的位置信息,并且依據這些信息,進一步提取每張人臉蘊含的身份特征,并將其與已知人臉庫中的人臉進行對比,從而識別每張人臉的身份。人臉識別的研究起源于19世紀末,其發展大致分成三個階段[5]:第一階段以面部特征為主要研究對象;第二階段稱為人機交互式識別階段,分為采用幾何特征參數來表示人臉正面圖像和統計識別為基礎的方法;第三階段才被稱為真正的自動識別階段,人臉識別技術進入實用階段。
3 常用的人臉識別方法
人臉識別的技術與方法一般分為:基于幾何特征的方法和基于模板匹配的方法。對于基于幾何特征方法而言,首先檢測出眼耳口鼻等臉部主要部件的位置和大小,然后分析這些部件的總體幾何分布關系以及相互之間的參數比例來識別人臉。基于模板的方法也叫做基于表象的方法,利用模板與整個人臉圖像的像素值之間的自相關性進行人臉的識別[6]。通過分析常用的人臉識別方法,本文將人臉識別的方法分為基于幾何特征的方法、基于模型的方法、基于統計的方法、基于神經網絡的方法。
3.1 基于幾何特征的方法
最早的基于幾何特征的方法由Bleclsoe提出,該方法將幾何特征定義為面部特征點之間的距離和比率,通過最近鄰方法來識別人臉,但必須手動定位面部特征點,因此屬于半自動系統。側影識別是另一個基于幾何特征的人臉識別方法,其原理是通過提取人臉的側影輪廓線上特征點,將側影轉化為輪廓曲線,提取其中的基準點,然后識別這些點之間的幾何特征。
基于幾何特征的方法非常直觀,能快速識別人臉,只需要較少內存,光照對特征的提取影響不大,缺點是當人臉變化時,特征的提取不精確,并且由于對圖像細節信息的忽略,導致識別率較低,因此近年來少有發展。
3.2 基于模型的方法
隱馬爾可夫模型(Hidden Markov Model,HMM)是一種常用的模型,基于HMM的方法被Nefian和Hayes引入到人臉識別領域,它是一組統計模型,用于描述信號統計特性。Cootes等人提出主動形狀模型(Active Shape Model,ASM),對形狀和局部灰度表象建模,定位新圖像中易變的物體[5]。Lanitis等用該方法解釋人臉圖像,其原理是使用ASM找出人臉的形狀,然后對人臉進行切割并歸一到統一的框架,通過亮度模型解釋和識別與形狀無關的人臉。
主動表象模型(Active Appearance Model,AAM)通常被看作是ASM的一種擴展,一般作為通用的非線性圖像編碼模式,通用的人臉模型經變形處理后與輸入圖像進行匹配,并將控制參數作為分類的特征向量。
3.3 基于統計的方法
基于統計的方法將人臉圖像視為隨機向量,采用一些統計方法對人臉進行特征分析,這類方法有較為完善的統計學理論的支持,因此發展較好,研究人員也提出了一些比較成功的統計算法。
特征臉方法由Turk和Pentland提出,該方法中人臉由各個特征臉擴展的空間表示,雖然人臉信息可以有效地表示,但不能對其進行有效鑒別和區分。為取得更好的人臉識別效果,研究者又提出使用其他的線性空間來代替特征臉空間[6]。Moghaddam等人提出了貝葉斯人臉識別方法,用基于概率的方法來度量圖像相似度,將人臉圖像之間的差異分為類間差異和類內差異,其中類間差異表示不同對象之間的本質差異,類內差異為同一對象的不同圖像之間的差異,而實際人臉圖像之間的差異為兩者之和。如果類內差異大于類間差異,則認為兩人臉圖像屬于同一對象的可能性大。
奇異值分解(Singular Value Decomposition,SVD)作為一種有效的代數特征提取方法,奇異值特征具有多種重要性質,如鏡像變換不變性、位移不變性、旋轉不變性以及良好的穩定性等,因此人臉識別領域也引入了奇異值分解技術。
3.4 基于神經網絡的方法
神經網絡用于人臉識別領域也有較長的歷史,Kohoncn最早將自組織映射(Self-Organizing Map,SOM)神經網絡應用于人臉識別,即使當輸入人臉圖像有部分丟失或者具有較大噪音干擾時,也能完整的恢復出人臉。人臉識別中最具影響的神經網絡方法是動態鏈接結構(Dynamic Link Architecture,DLA),對網絡中語法關系的表達是該方法最突出的特點。
用于人臉識別的神經網絡還有:時滯神經網絡(Time Delay Neural Net-works,TDNN),是MLP的一種變形,徑向基函數網絡(Radial Basis Function Network,RBFN)以及能有效地實現低分辨率人臉的聯想與識別的Hopfield網絡等[6]。
與其他人臉識別方法相比,神經網絡方法具有特有的優勢,人臉圖像的規則和特征的隱性表示可通過對神經網絡的訓練獲得,避免了特征抽取的復雜性,有利于硬件的實現,缺點是可解釋性較弱,要求訓練集中有多張人臉圖像,因此只適合于小型人臉庫。人工智能應用在人臉識別、模式識別方面能夠提高運行效率、減小計算量小、程序的代碼編寫更為簡潔。
【參考文獻】
[1]武海麗.初識人工智能[J].科技創新導報,2009,02:196.
[2]王甲海.創新型人工智能教育改革與實踐[J].計算機教育,2010(08):136.
[3]肖斌,薛麗敏,李照順.對人工智能發展新方向的思考[J].信息技術,2009,12:166-168.
[4]朱祝武.人工智能發展綜述[J].中國西部科技,2011,10(17):08-10.
[5]裴佳佳.基于子空間的人臉識別技術研究[D].浙江工業大學,2009.
[6]李武軍,王崇駿,張煒,陳世福.人臉識別研究綜述[J].模式識別與人工智能,2006,19(01):58-66.
[責任編輯:丁艷]