茹志鵑
(正德職業技術學院,211106)
基于動態視頻的人臉識別技術研究
茹志鵑
(正德職業技術學院,211106)
隨著高科技的發展,人臉識別技術也在不斷發展。如今市場上已經出現多種人臉識別技術。人臉識別技術作為一種生物特征識別的典型應用被應用到各個領域,如國防、司法、金融等,受到了社會的關注與認可。
動態視頻;人臉識別;原像比對
人臉識別技術的起源時間為1888年到1910年之間。如今隨著社會的發展,人臉識別技術已經發展成為鑒別人物身份的一項重要手段,尤其是在公共安全領域以及商業領域有著廣闊的發展前景。
動態人臉識別的主要組成模塊包括人臉的監測、人臉的跟蹤、人臉的特征提取以及人臉的識別。具體可參照下圖。
跟傳統靜態圖像的人臉識別的方法不同的是,動態人臉識別方法將視頻流以及視屏圖像作為研究的對象,除了對圖像幀的內在信息進行關注之外,還需要對幀的前后關系進行具體分析,發現其中的關聯。因此,動態人臉識別技術相對于傳統的靜態人臉識別技術來說更具難點,也更先進。具體體現在以下幾方面:
(1)視頻的圖像序列中包含著大量的多余信息,動態視頻人臉識別技術對信息的篩選能夠提升靜態人臉識別的效果。
(2)視頻中的動態信息為識別系統提供了人臉的靜態圖像,通過靜態圖像構建的人臉模型還能夠隨著時間的變化而變化,提升識別的質量。
(3)從視頻的有序人臉集出發能夠得到更加精準的人臉表達效果,如超分辨技術的采用能夠得到更高的識別效果,但是因為動態視頻的獲取中有很多不可控因素的存在,如環境的變化,人與攝像機未知的變化都可能造成圖像的模糊,識別困難。因此面向視頻的動態人臉識別問題還有很多難題需要人們的克服。
2.1關鍵幀方法
顧名思義關鍵幀的方法指的是在視頻序列中參照以前已經確定好的規則選擇其中的關鍵幀作為原始的輸入,視頻的人臉識別問題則轉化為關鍵幀的人臉圖像以及模板庫人臉圖像的靜態人臉圖像的匹配問題。但是因為采用這種方法參照標準具有很大的主觀性,沒有客觀的參照標準,因此需要進行質量的篩選,從視頻序列中選擇質量最優的圖像進行比對。這種方法的運用的優點在于比對的次數較少,處理的速度快。但是因為沒有統一的標準,因此很難被人們所接受。除了選擇關鍵幀進行比對的方法之外,還有對同一對象的多張關鍵幀進行比對,隨后進行匯總,這種方法中最簡單的做法是,從設備跟蹤到人臉視頻中選擇幾種關鍵幀,對每一幀進行圖像比對,最后根據關鍵幀識別結果的融合得出結論。這種做法利用的視頻人像的多樣性,其存在的缺點為識別結果的質量取決于融合的規則,目前還沒有統一的規則,因此在最終的結果比對上顯得過于隨機。
2.2圖像集方法
視頻是多種圖像的結合,因此對視頻的處理能夠歸結為對圖像集的操作,動態視頻人臉識別技術的關鍵步驟就是對圖像集的人臉識別。根據設備所跟蹤到人臉圖像,采用超分辨技術、建模技術以及統計分析等技術對人臉的動態信息進行整合,概括下來可分為下面幾種。
2.2.1圖像超分辨技術
人臉識別技術質量會隨著圖像分辨率的下降而下降,因此圖像超分辨技術被應用到了動態視頻的人臉識別技術。圖像超分辨技術通過對多張分辨率的整合對人像進行重構,重新識別,這種方法的運用彌補了因為圖像的分辨率過低而造成的識別技術的偏差。然而圖像超分辨技術對于圖像集的對齊方式比較敏感,圖像集的對齊問題成為其需要攻克的難關。
2.2.2統計模型的方法
視頻人臉圖像是對人的某一個階段的表象描述。如果將被監測人的每張圖像當做一個觀測樣本,這種的圖樣樣本可以滿足一定的統計特性。這種情況下可以采用PCA刻畫的方式對每個人的子空間信息進行刻畫,也或者采用利用模型描摹出每個人的臉。集合間的相關性也被用在集合間的度量,因此得到不同人臉之間的相似度,并進一步判斷出分類的特征。為了避免因為人臉的姿勢造成的識別影響,因此采用GMM用來對人臉的細節進行描述,并以此為基礎提出概率彈性局部模型。因為人臉在不同的光照,不同的姿勢,不同的表情變化時呈現出非線性分布,并通過核方法可將原空間映射到高維非線性空間,在此基礎上使用核主成分的夾角作為相似度度量能對人臉圖像集進行識別。而在其他的文獻中還提到了主成分零子空間辦法,這種方法能夠有效處理非均勻樣本分布和非白噪聲的情況。
2.2.23D重構的方法
人臉姿勢的問題也是動態視頻人臉識別技術一項需要攻克的難關。3D重構的方法是根據人臉的結構,對人臉進行合成,這種方法的運用能夠有效減少因為人臉的角度的問題出現的偏差。根據重構對象的不同,利用重構能夠實現對人臉的3D復原,進行監測對象臉部3D建模。通過對人臉姿勢以光照問題的預測,可使用在庫人員的3D臉模型,對不同庫人員的2D人臉圖像進行比對,識別。這種方法減少了因為姿勢的差異帶來的識別困難,但是因為其運算成本較大,因此使用并不廣泛。
2.2.4流行的方法
流行是一種刻畫樣本集的工具。互子空間的方法的度量為集合之間主成分的夾角相似度量,對線性子空間與線性子空間的距離。在此基礎上可以將流行看作是不同線性結構快的結合,流行與流行之間的距離定義為兩個線性結構快之間的距離,而對流行的線性逼近則稱之為最大的線性結構快。使用流行距離的方法,動態視頻人臉識別技術的正確識別效果達到了96%。若在流行方法的基礎之上在計入鑒別學習機制,則能進一步提升識別效果。另外,概率靜觀流行的方法與局部線性嵌入的方法也被廣泛應用到視頻人臉識別之中。

圖1 面向視頻的動態人臉識別流程圖
本文主要對目前流行的動態視頻人臉識別技術方法進行了分析,總結其優勢以及存在的不足。雖然動態人臉識別技術經過若干年的發展已經有了小部分的成就,但是在非可控、復雜的情況下依然很難得到較好的識別效果。如在車站,或者是在重點的要求較高的監控場所,因為受到人臉姿勢以及光照等的影響,很難得到良好的識別效果,這也成為之后的動態視頻人臉識別技術的難點。
[1] Phillips PJ,Scruggs WT,O’Toole AJ,Flynn PJ,Bowyer KW,Schott CL,and Sharpe M.FRVT 2006 andICE 2006 Large-Scale Experimental Results[J]. IEEETransactions on Pattern Analysis and MachineIntelligen ce,2(5):831-846,2010.
[2] Galton F.Personal identification and description[J]. Nature,173-177,1888.
[3] 梁路宏,艾海舟, 何克忠.基于多模板匹配的單人臉檢測[J].中國圖像圖形學報, 1999
茹志鵑(1980.12-),女,河南澠池人,正德職業技術學院講師,研究方向:計算機應用專業
The research on Face recognition technologybased on dynamic video
Ru Zhijuan
(zhengde polytechnic,211106)
With the development of high-tech,face recognition technology is also in constant development. Now It has appeared on the market a variety of facial recognition technology.Facial recognition technology,as a typical application of biometrics has been applied to various fields,such as national defen se,justice,finance,etc.,has
the attention and recognition.
dynamic video;Face recognition;The original like than