□孫 茜
壓縮感知(CS)理論是目前信息工程相關領域研究的前沿熱點之一。它打破了傳統的奈奎斯特采樣定理,相比于其要求的最小采樣頻率,CS理論證明了能夠從更低數目的采樣中以高概率完整地恢復原始信號,在保證信息特征不丟失的前提下節省了數據采集和處理的時間成本。
壓縮感知理論本質上可以視為處理線性信號恢復問題的工具,因此在求解信號和圖像的逆問題上有著顯而易見的優勢。信號的采樣速率也不僅由帶寬決定,與信號或信息的稀疏性密切相連。稀疏在模式識別領域的概念可以簡要概括為信號中的非零元素較少,也就是眾多信號的系數均為零或趨近于零。
壓縮感知理論的核心思想之一,便是現在在模式識別領域應用廣泛的稀疏表示分類算法,即SRC(sparse representation-based classifier),這是一種對于光照、噪聲較為魯棒的分類方法。
SRC算法可以被視為一個將輸入圖像轉化為具有光照、表情等訓練圖像的線性組合的過程。假設我們有n組,第i類有ni個訓練樣本,ai,j∈RD×1表示第i類中的第j個人臉樣本圖像,所構成的D表示圖像特征向量的維數,Ai=[ai,1,ai,2,…,ai,ni]∈RD×ni包含第i類的訓練圖像。A=[A1,A2,…,An]表示全部的訓練集,y代表一個輸入測試圖像。為避免l0模引起的NP-hard問題,SRC通常使用l1模最小化約束進行分類:
(1)
其中,x是稀疏系數特征,ε是與有界能量的噪聲項相關的參數。x*T=[x1*T,x2*T,…,xn*T]表示最優解,xi包含著第i類的相關系數。
SRC算法雖然已獲得很好的識別性能,但一個潛在的問題在于SRC算法中測試圖像可能是被不同對象的訓練樣本所表示出來。在人臉識別過程中,這個問題容易造成錯誤的識別。理論上,測試圖像應該只被其對應對象的訓練圖像所表示。針對這一問題,Elhamifar等人提出一種更為魯棒的分組稀疏表示分類方法,該方法主要是盡可能少的對象的訓練圖像表示出測試樣本,首先將訓練數據字典劃分為不同組,每一組由來自同一個對象的訓練圖像組成,然后搜索出一種在進行識別時使用最少分組數目的表示方法。這等價于將分類問題轉化為結構稀疏恢復問題。
給定一個測試圖像y,通過以下的凸問題得到稀疏系數x,從而最大限度減少字典中的非零組數目。
(2)
其中,xi表示第i類相關的系數,ε是相關噪聲參數,A=[A1,A2,…,An]表示一個完整的訓練集。
人臉識別是一項正應用在諸多行業的計算機通信領域技術,例如,應用于企業單位考勤系統、應用于學校識別師生信息、應用于公安系統識別案件相關人員等,但人臉識別技術在實際應用時,往往識別對象會有不同的姿態與表情,進行識別時的光照條件也不穩定,所以人臉識別在面對光照、姿態、表情等變化時效果會受到一定的影響。
人臉識別技術的主要原理是利用一系列圖像處理技術從圖像中提取人像特征點,第一,對采集到的人臉圖像進行有效特征信息的檢測,例如,檢測人臉的直方圖特征、結構特征及顏色特征等。第二,在檢測到人臉特征的基礎上進行圖像的光線補償、濾波及銳化等操作,這是為了減少人臉原圖上存在各種信息干擾。第三,在獲取已經過預處理的人臉圖像后,對人臉進行特征信息的提取,例如,對人臉圖像上的眼睛、鼻子、嘴和下巴等特征元素進行提取,描述這些特征元素之間的結構關系。第四,將已提取出的人臉特征信息與已收集好的人臉數據庫進行對比,也即是與數據庫中的人臉特征模板進行比較,通過比較二者之間的相似程度,對測試的人臉身份信息進行相應的判斷。
基于壓縮感知的稀疏表示SRC技術由于對光照和噪聲變化較為魯棒而廣泛應用在圖像處理領域,例如,對圖像進行噪聲去除、對圖像的模糊信息進行處理、對圖像分辨率的處理等,并在此基礎上,不斷探索與創新如何將其應用于日常實際工作領域之中,當下運用最為廣泛的方面之一便是人臉識別技術領域。
稀疏表示應用在人臉識別領域的首次探索是在2009年,當時由Wright等人提出基于稀疏表示的分類方法,旨在尋找單張人臉圖像在人臉圖像數據庫中的最稀疏表示。Yang M等人在2010年提出基于Gabor特征的稀疏表示方法,使用圖像的局部Gabor特征用于稀疏表示之中,但這一方法并未考慮到數據的內部特征。Elhamifar等人在2011年提出基于分組稀疏表示的人臉識別分類方法GSRC,解決了SRC并未考慮訓練數據字典內部結構信息的問題,進一步提高了人臉識別的有效率。而后幾年基于核的稀疏表示分類方法KSRC成為研究熱點,進一步提升了人臉圖像分類效果。2015年Jiang X等人提出用于人臉識別的通過字典分解的稀疏與稠密相混合的表示方法SDR,改善了在實際應用之中訓練樣本足夠和訓練數據無遮擋這兩點影響識別性能的問題。
張濤、吳鍵2017年在《基于PCA和SRC算法的人臉識別儲物柜系統的設計與實現》中提出將主成分特征提取方法PCA應用于人臉圖像的特征提取中,并最后使用稀疏表示進行人臉圖像分類的新方法。首先介紹了PCA特征法提取人臉圖像特征向量的工作原理,闡述了如何實現稀疏表示分類,再聯系人臉識別儲物柜進行硬件實現和軟件流程的介紹,最后進行人臉識別的分類試驗。
2018年木立生、呂迎春針對人臉識別在有遮擋、表情、光照的變化或受到噪聲污染時魯棒性變差問題,提出一種基于稀疏表示與特征融合的人臉識別新方法。首先考慮將人臉原始圖像變換為更為簡潔的人臉,該新方法提出可以通過低秩恢復算法進行實現,再提取上一步得到的干凈人臉圖像的特征向量,即LBP,HOG,Gabor特征;然后對部分訓練樣本進行稀疏表示分類測試,根據識別結果與分類殘差計算出最小的權重向量;最后根據該權重向量重構規則化殘差進行分類。
王國權和鞏燕在2019年提出在人臉識別過程中將圖像小波特征分析與稀疏表示相結合新方法,通過小波分析將圖像進行分層,得到一副低頻分量與水平、垂直、對角線分量,然后對人臉圖像進行主成分特征提取和降維,稀疏表示各個圖像,再根據分類器性能不同,判斷多個分類結果,實現不同復雜干擾情況下的圖像識別。
2020年吳慶洪和高曉東考慮到支持向量機對特征提取的優越性能,而稀疏表示分類方法對光照、噪聲變化較為魯棒,提出將二者相結合的人臉識別新方法,該方法首先對非理想環境下人臉特征進行提取操作,組合成為一個非理想環境下的人臉識別的特征字典;然后,采用特征字典對非理想環境人臉識別訓練樣本和測試樣本進行處理,構建非理想環境人臉識別的學習樣本;最后,采用支持向量機建立非理想環境人臉識別的分類器來對非理想環境人臉進行識別。
2021年王鈺、劉凡等人提出一種基于自編碼器和稀疏表示的單樣本人臉識別算法,在保留身份信息的同時自動生成帶變化的人臉圖像用于單樣本條件下的字典擴充,一定程度上緩解了單樣本條件下的欠采樣問題,對人臉圖像訓練集與測試集之間的人臉信息的變化與不同進行了彌補,讓稀疏表示方法也可以在應用于單樣本人臉識別。
此后,曹玉濤與吳愛弟提出基于小波分析和復矩陣稀疏表示的人臉識別方法,該方法通過對人臉圖像進行2層小波分解,提取出第2層小波分解得到的低頻部分和高頻部分,將3個方向的高頻子帶分別做分塊處理,計算每個子塊能量值,而后在每個方向上選取若干子塊,且這些子塊是其中信息量較多的,再將這些子塊進一步整合成為一個新的高頻子帶,再將新的高頻子帶和原低頻子帶構成1個復矩陣。最后,使用稀疏表示SRC進行人臉圖像的分類。
由于在提取人臉圖像的特征時,常會得到許多不相關的冗余信息,而編碼不充分稀疏時,也無法得到簡潔的人臉圖像,宋珊、馮巖等提出基于正交稀疏約束非負張量分解的人臉識別新方法,主要在人臉特征提取時采用非負張量分解這一新方法,在保有人臉特征的內部結構完整的基礎上,降低特征之間的不相關性,最后通過稀疏表示方法及余弦相似度來進行人臉圖像的分類與識別。
人臉識別的過程往往會受到遮擋、表情變化、姿態變化等因素的干擾,狄嵐、矯慧文等針對這一問題,提出了稀疏綜合字典學習的識別方法,構造混合特色字典,利用鏡像原理和Fisher準則增加人臉圖像訓練樣本的多樣性,從而提高測試人臉圖像的識別率。
這些基于稀疏表示,并進一步將稀疏表示與不同圖像處理方法相結合的人臉識別新方法,都在諸如AR、ORL等不同的人臉圖像數據庫上進行了方法測試,并將其與傳統人臉識別技術進行識別率的對比,其結果均表明稀疏表示算法對于在不同姿態、不同表情和不同光照下的人臉識別具有較優魯棒性。