韓昊南京航空航天大學金城學院
對人臉識別系統及關鍵技術的探討
韓昊
南京航空航天大學金城學院
隨著我國信息技術的快速發展,人臉識別技術在機器學習、圖像處理、人工智能等專業技術的支持下實現了較為長足的進步,各種算法的層出不窮就是這一進步的最直觀體現,而為了使更多人深入了解人臉識別技術,本文就人臉識別系統及關鍵技術展開了深入探討。
人臉識別系統;關鍵技術
隨著計算機信息時代的來臨,人臉識別技術如同“開掛”般發展,這種發展就使得人臉識別技術在學術界與商業界都取得了較為長足的成果,而為了更好將這種成果展現給大家,正是本文就人臉識別系統及管件技術展開具體研究的原因所在。
2008年人臉識別系統首次亮相我國奧運會,而這一由中國科學院自動化所自主研發的人臉識別系統也標志著我國人臉識別技術研究處于世界領先地位。對于我國當下的人臉識別系統來說,其本身能夠在身份證等智能卡、網絡相關信息安全、視頻監控等公共安全、車輛管理等出入控制、自動登錄系統等人機交互領域實現較好應用。
對于我國當下的人臉識別系統研究來說,人臉檢測、人臉特征描述與提取即特征提取、人臉特征降維、人臉屬性特征分類與人臉識別等四個方面是其主要研究領域,其中人臉檢測主要應用支持向量機、神經網絡實現;而人臉特征描述與提取即特征提取則需要得到主成分特征提取方法、獨立元特征提取方法的支持;而對于人臉特征降維來說,這一研究需要得到PCA、LDA等現行降維方法與LLE、ISOMAP等非線性降維方法的支持;而對于人臉屬性特征分類與人臉識別來說,隱馬爾可夫模型方法、核線性判別方法都能夠在其中實現較好應用[1]。
由于近些年世界范圍內的人臉識別系統發展迅速,這就使得人臉識別系統相關的關鍵技術數不勝數,為此筆者結合自身實際工作經驗與相關文獻資料,對基于圖像集的人臉識別、姿態估計、網絡攝像頭數據解碼等三類典型的人臉識別系統關鍵技術展開了詳細論述,希望這一論述內容能夠為相關研究人員帶來一定啟發。
2.1 基于圖像集的人臉識別關鍵技術
對于基于圖像集的人臉識別關鍵技術這一人臉識別系統的關鍵技術來說,這一技術能夠較好解決光照變化、姿態變化、遮擋等因素對人臉識別系統工作帶來的影響。之所以基于圖像集的人臉識別關鍵技術能夠發揮這一效用,主要是由于這一技術允許決策方法基于最相似的一對測試集和訓練集的比較,這自然使得人臉識別系統能夠取得更好的應用效果[2]。
對于基于圖像集的人臉識別關鍵技術來說,圖像集的采集、人臉圖像的預處理、對圖像集進行建模、相似度比較、輸出識別結果等五個方面稱得上是其關鍵所在。而在具體的對圖像集進行建模中,基于仿射包建模是一種較為有效的建模方法,這一建模方法能夠通過利用凸模型之間的幾何距離比較判別不同的類,這就較好實現了不同光照、角度等人臉識別影響因素的處理;而在相似度比較中,這一比較能夠通過對個體間差異的比較較好就滿足人臉識別需求,應用最近鄰方法計算相似度是這一比較中最常見的方法[3]。
值得注意的是,特征處理同樣屬于基于圖像集的人臉識別關鍵技術的重要組成,當下業界流行著LBP特征提取與LPQ特征提取兩種特征提取方法,LBP特征提取全稱為局部二值模型,其本身能夠實現簡單高效的圖像紋理特征提取,而由于LBP特征提取還具備著光照較好魯棒性,這就使得因光照造成的人臉識別影響能夠在LBP特征提取的作用下實現較好解決處理;而LPQ特征提取則被稱為局部相位量化,其本身能夠較好實現空間模糊圖像紋理的描述算子處理,而由于LPQ特征提取具備模糊不變性,這就使得其本身能夠通過將原圖像轉換為LPQ圖像,并最終轉換為LPQ直方圖完成具體的人臉識別。由于這兩類處理都能夠較好滿足基于圖像集的人臉識別關鍵技術光照變化、姿態變化、遮擋等影響因素的消除,我們就能夠直觀認識到這一基于圖像集的人臉識別關鍵技術對于人臉識別系統的重要性[4]。
2.2 姿態估計關鍵技術
對于姿態估計關鍵技術來說,這一技術主要針對用戶不刻意配合情況下的人臉識別,其本身能夠在這種情況下最大化人臉識別系統的有效性。對于這一人臉識別系統中的姿態估計關鍵技術來說,其本身需要得到支持向量機、人臉姿態數據庫的支持。對于支持向量機來說,其本身屬于一種監督學習算法,由于其本身在統計樣本量較少的情況下具備著較強統計規律能力,這就使得其能夠較好滿足人臉識別系統姿態估計關鍵技術的需求;而對于人臉姿態數據庫來說,其同樣能夠為人臉識別系統姿態估計關鍵技術帶來有力支持,由于這一人臉姿態數據庫包含著不同時間、不同光照條件下的人臉數據,這就使得用戶不刻意配合情況下的人臉識別將因此得以較好實現。
2.3 網絡攝像頭數據解碼關鍵技術
除了上述兩方面關鍵技術外,網絡攝像頭數據解碼同樣屬于人臉識別系統的關鍵技術,這一技術能夠較好滿足城市安全監控中網絡攝像頭的人臉識別需求,我國治安水平也將在這一網絡攝像頭數據解碼關鍵技術的支持下實現較好提升。這里我們以海康網絡攝像頭作為硬件采集平臺,而對于這一網絡攝像頭的數據解碼關鍵技術來說,其本身的效用發揮需要得到海康提供的HCNet SDK.dll、Play Ctrl.dll等5DLL庫支持,這些DLL庫發揮著形成數據鏈條實現信息交換、數據的實時解碼以及預覽、加快解碼效率、進行視頻流的標準轉換等工作,這些工作都將為網絡攝像頭數據解碼關鍵技術的效用更好發揮提供有力支持。
在本文就人臉識別系統及關鍵技術探討展開的研究中,筆者詳細論述了人臉識別系統相關概念,并對人臉識別、姿態估計、網絡攝像頭數據解碼等三類典型的人臉識別系統關鍵技術展開了詳細論述,結合這一系列論述內容我們不難發現,人臉識別技術想要較好應用于我國各個領域,就必須解決光照、姿態、遮擋等因素造成的人臉識別影響,而這就需要得到相關技術水平較高的算法支持。
[1]吳煌鵬.人臉識別算法研究及其DSP實現[D].華僑大學, 2014.
[2]袁正海.人臉識別系統及關鍵技術研究[D].南京郵電大學, 2013.
[3]張彥.人臉識別系統中特征提取及光照問題的研究[D].江南大學,2013.
[4]田海軍.基于支持向量機的人臉識別技術研究與實現[D].國防科學技術大學,2009.