王京航 周治國 張澤興


關鍵字:非負矩陣分解;人臉識別;生物特征;特征提取;身份驗證
0 引言
人臉識別技術被越來越廣泛地應用于各種行業場景之中,手機支付[1]、公安偵查、在線教育[2]、出行登記等領域都使用到了人臉識別進行身份驗證,許多學者也在不斷深入研究和改進相關技術,提高人臉識別的準確率。將非負矩陣分解(NMF, Non-negative Matrix Factorization)[3]應用于在人臉識別技術中的研究是備受關注的方向之一,通過改進傳統的NMF算法,在提高人臉識別精確度和效率上取得了更積極的進展[4]。
1 人臉識別技術
人臉識別是基于臉部特征驗證身份信息的一種技術,人臉特征與聲紋、視網膜等其他人體生物特征一樣,在身份識別過程中具有唯一性和易采集性,與其他的生物特征識別技術相比,人臉識別還是一種更加便利快捷的非接觸式且非侵入式身份鑒別方法,可以應用于視頻監控、刑偵取證和數字支付等更加豐富的場景,眾多的特性和優勢使其成為比較重要的研究技術之一。在大多數人臉識別技術的算法流程設計中,基本可以概括為以下4個步驟,第1步是人臉檢測,對于被檢測的人臉圖像進行預先處理,清除光線、場景以及遮擋物等負面干擾,將人臉對齊并確定準確的圖像位置框線;第2步是特征提取,定位人臉的關鍵點并提取出精確的局部圖像數據,再從得到的圖像中獲取人臉五官和面部特征,區分出相關性強的信息來簡化圖片;第3步是人臉校驗,將提取出的特征與數據庫中的圖像逐一進行分類、比對和檢索;最后是人臉識別,確定被查驗人的身份信息。人臉識別的簡要過程如圖1所示。
近幾年來,對于人臉識別技術的研究發展迅速,其中人臉圖像特征提取是人臉識別過程中最基礎也是最關鍵的一環,可以將非結構化抽象圖片表達為向量,并通過降低維數減少無關輸入特征信息,使冗余最小化,提高訓練人臉圖像效率及準確率[5]。精準的特征提取能夠更好進行下一步工作,并且人臉識別正確率往往取決于特征提取的準確性,為了提高識別的準確率,各種人臉面部特征提取方法被相繼提出。從特征提取的范圍方面大致可以分為兩方面,一方面是基于整體的特征提取,例如主成分分析(PCA, Princi? pal Component Analysis)算法[6];另一方面是基于局部的特征提取,例如非負矩陣分解算法。
2 非負矩陣分解
Lee和Seung[3]提出了非負矩陣分解的相關內容,作為一個特征提取方法能更好描述多維觀測數據,實現將高維的矩陣數據分解為非負低維的基矩陣和系數矩陣,該技術在模式識別、聚類、降維等領域得到了廣泛的應用。非負矩陣分解的主要思想簡述為:給定一個任意n × m 維的矩陣V,對所有矩陣元素使用非負約束條件,將矩陣V 分解為非負的n × r 維基矩陣W和非負的r × m 維系數矩陣H,并且盡可能使V ≈ W × H,其中r 值的大小應確保滿足約束(n + m) × r < n × m,其根本目標就是最小化V 與W、H 之間的歐幾里得距離,方法的構造過程體現了整體是由局部組成的。
自非負矩陣分解被提出以來,已經應用于許多不同研究領域中,其中具有代表性之一的是人臉識別。人臉圖像在概念上可以被定義為一個稀疏分布五官集合的表示,人臉識別在不同環境中發生的是一類局部變化,NMF作為一種基于局部特征的表示方法[7,8],在處理和重建局部遮擋或噪聲密度高的人臉識別更具適用性。當對人臉圖像進行連續數值分析時,計算中的負值往往是不具有解釋性的,使用非負矩陣分解可以有效避免這個問題。在處理大規模的人臉圖像庫時通常會使用矩陣,非負矩陣分解的非負性會引發稀疏,因此在處理復雜數據時更加便捷且存儲空間占用少,利用NMF方法分析大規模的文字、人臉圖像等非結構化數據,比傳統方法的處理算法時間復雜度更低、更方便,這也為人臉識別的研究提供了很好的思路。
3 使用非負矩陣分解算法應用于人臉識別的方法
目前,在使用NFM進行人臉識別的方法中,為了解決一些傳統NFM算法的局限性,各專家學者不斷地在原有的基礎算法上進行改進和創新,主要包括以下三個方面:基于技術融合的NMF 方法、基于正則化NMF方法和基于稀疏性增強的NMF方法。NMF改進方法及其優點如表1所示。
3.1 基于技術融合的NMF 方法
Purnomo等人[9]提出了一種基于Gabor Wavelet和非負矩陣分解的融合方法,在提取人臉特征時使用Gabor核,再運用NMF來降低矩陣維數,結果表明在噪聲密度較高的人臉圖像識別中依然取得了較高的準確率。Ali等人[10]提出了OEPA-NMF的一種融合方法,聚集了局部表征中的最佳結果,并介紹了其在人臉和人臉表情識別中的應用效果,論證了NMF在人臉圖像中對于特定部分識別的顯著效果。鄭明秋等人[11]通過對原始公式重復進行迭代運算,得到新的基矩陣和系數矩陣,并對NMF算法改進后用于特征提取,再結合神經網絡進行人臉識別,能夠有效降低神經網絡的訓練復雜度。Sabzalian等[12]提出了迭代加權非光滑非負矩陣分解(IWNS-NMF, Iterative Weighted Non-smooth Non-negative Matrix Factorization),使用特征系數權值控制函數,形成光滑矩陣,增強數據重要特征的同時削弱無關特征,提高了在降維空間中的分類可行性,該方法在人臉識別以及視頻、文字識別中都更加適用。針對光照因素對人臉識別準確率的影響,伊力哈木·亞爾買買提等[13]改進了增量非負矩陣分解算法用于特征提取,基于分塊矩陣將原始數據和新樣本進行分類,解決了傳統NMF在大量數據進行更新時需要重新迭代導致耗時較長的問題。在面向低分辨率人臉識別應用領域,王超等[14]提出了添加松弛耦合的改進非負矩陣分解算法,首先在系數耦合中添加松弛約束,使用分別訓練分解高低分辨率圖像得到基矩陣,再進行局部特征提取,使得到的高低分辨率特征系數能夠近似相等,有效的解決低分辨率人臉識別的問題。
3.2 基于正則化NMF 的方法
局部非負矩陣分解(LNMF, Local Nonnegative Ma? trix Factorization)是Stan等[15]提出的子空間學習方法,由于傳統NMF可能出現低識別精度的問題,額外增加了空間上的局部化約束,進而學習基組件的局部特性。Deng等人[16]提出了圖正則化非負矩陣分解算法(izGaNtiMonF),,可Gr以ap在h R保eg留ul圖ari像zed局N部on幾ne何ga結tiv構e M的a同trix時F,a學cto習r?深層特征,結合圖結構增強算法的判別能力,采用節點相關性拓展數據的學習,打破了傳統NMF忽略數據空間中幾何結構的局限。繼前兩種方法的提出,LONG等人[17]又提出了圖正則化判別非負矩陣分解算法(GDNMF, Graph Regularized Discriminative Non-neg? aMtiFve的M缺at陷rix,F該ac方to法riz本ati質on上),優是化一并種改有進監了督的LN分M解F和方G法N,?結合局部不變性思想和判別標簽進而優化學習的精度,在提高判別能力的同時擁有更低的時間復雜度。CGaraip等h R人e[g18u]提lar出ize流d N形on正ne則gat化ive非M負atr矩ix陣Fa分cto解riz(aGtiRonN)M,通F,過合并一個基于幾何的正則化器來避免幾何結構的限制,同時提出了基于雙因子矩陣迭代更新求解目標函數的優化方案,形成了一種新的基于局部的數據表示方法,使得該算法優化了語義結構上的特征表示。dGiueannt 等De人sc[e19n]提te)出優一化種的用流快形速梯正度則下化降判(F別GDN, FMaFst(MGDra-? NMF, manifold regularized discriminative NMF),在人臉圖像分類和聚類問題上同樣展現了比較好的效果。TZohpaonlgog等y[2P0]re提se出rvi了ng新No的n-拓neg撲at非ive負M矩atr陣ix F分ac解tor(iTzPatNioMnF),,通過保留了空間中原始的局部拓撲結構,可以有效表示人臉圖像中的流形結構。
3.3 基于稀疏性增強的NMF 方法
Hoyer等人[21]在NFM中添加了稀疏性約束,使用梯度投影逐步減少目標函數,并可以顯式地調整稀疏性參數以改進分解。周靜等人[22]提出了新的收斂目標函數,在凸非負矩陣的基礎上改進了迭代規則,并通過增加稀疏性約束的方法減少冗余信息,得到更準確特征表達,使用閾值判斷進行稀疏性約束基矩陣為0~1陣,使識別的誤差更小。John等人[23]通過結合稀疏特征表示提出一種圖像分類方法(SHNMF, Sparse tHioynp)e,r采gra取ph直re接gu使lar用ize稀d 疏No表nn示eg的ativ方e式M對atr樣ix 本Fa進cto行riz分a?類,并能有效提高對有遮擋人臉識別的魯棒性。Lang 等人[24]提出對人臉圖像進行非負稀疏編碼,得到了局部面部特征,能夠很好地識別局部遮擋人臉圖像,并具有更好的魯棒性。Dobrovolskyi等人[25]提出了稀疏對稱非負矩陣分解算法,在人臉圖像庫進行聚類實驗中,其稀疏性使對象特征表示更加緊湊,相比之前的對稱非負矩陣分解,由于其可調的稀疏性水平,此算法更容易理解且更具有穩健性。Melisew等人[26]在對稱非負矩陣分解中添加了新的基于L1范數的稀疏性約束,增強了對基特征的提取,且能夠更好表示局部數據特征并節省存儲空間。Pu等人[27]提出了一種新的基于稀疏約束的非負矩陣分解法和Fisher線性判別法的人臉識別方法,將訓練集中的人臉圖像分類并尋找最優子空間,進行人臉局部表示。Guo等人[28]提出了稀疏卷積非負矩陣分解(SCNMF, Sparse Corruption Non-Negative Matrix Factorization),得到了具有抗噪性的基矩陣,可以重建有損壞的人臉數據,使圖像更加清晰易于識別。
4 結語與展望
本文主要總結了幾類將NMF算法改進并應用在人臉識別上的典型方法,而后分別進行了概括性的介紹。從目前人臉識別技術的發展情況來看,在這一技術的應用中比較突出的重點和難點在于識別的準確率和效率,需要盡量排除外界環境因素和不可控情況(雙胞胎、表情變化等)的干擾。在使用NMF算法進行人臉特征提取的相關研究內容上,仍然要繼續針對重難點問題進行突破。除此之外還有三個方向是未來研究的重點,一是拓展幾何數據空間的關聯意義;二是關注NFM算法的分解情況,在追求局部最小的同時也要盡量達到局部最優;三是通過融合其他技術提出新的改進NFM算法進行人臉識別,使得識別的能力更加全面、準確和高效。