鄧定勝
(四川民族學院理工學院,四川康定626001)
近年來,隨著計算機及人工智能技術的飛速發展,計算機人工智能逐漸通過替代人腦對周圍復雜環境進行感知、識別和判斷,進而代替人類完成一些常規的反饋行為。其中計算機視覺分析識別技術是其中關鍵一環,依托于計算機視覺技術的圖像識別領域也是目前研究的熱點之一,廣泛應用于圖像處理、自動化控制、信息識別融合等領域[1-2]。人臉識別作為圖像識別中最為關鍵的應用領域已在現代社會中得到廣泛的應用。
有研究表明,稀疏表示分類方法(Sparse Representation Classification,SRC)在人臉識別技術領域取得了良好的識別效果[3]。SRC 對人臉面部區域進行稀疏表示,把人臉區域表情動作訓練成一組冗余的基礎(字典)求解稀疏優化問題,每一個字典代表一個特定的面部表情,基于這個完備字典去做分析并將面部辨識出來[4-6]。為此,學界對SRC 在人臉識別中的應用進行了大量研究,有學者基于稀疏表示進行人臉識別,給出了具有代表性的完整字典,包括了大部分臉型的子空間,可快速甄別不同的人臉,同時采用經典的字典訓練方法將分類器的性能進行優化[7-8];也有學者提出可通過稀疏線性組合(Sparse Linear Combination,SLC)將多張訓練影像組合成測試影像,該方法除了能有效改善影像對于光源、表情及遮蔽的情況,在分類效果上也優于最近距離法及線性支持向量機[9]。為了進一步證明SRC 在訓練特征充足的情況下可以任意將臉部數據組成測試影像,有研究者將識別系統設計成每一類以數十張影像去涵蓋所有可能的光源變化,且大部分稀疏表示分類的相關研究也是基于此假設下的實驗設置進行比較,但對于測試樣本少的環境,SRC 仍具有一定局限[10]。因此,有學者提出了協同表示分類算法(Collaborative Representation Classification,CRC)用以針對樣本較少情況的人臉圖形識別[11]。
本研究將SRC 聯合CRC,并通過概率協同子空間,提出稀疏增強概率CRC。所謂稀疏增強即利用稀疏表示系數來增強概率系統表示分類算法的表示系數,進而解決測試樣本少、圖像遮擋及像素污染情況下的圖像識別問題,提高人臉識別的魯棒性,并應用于機器學習中。
SRC是將一個信號樣本表達為字典元素中的一組線性組合的技術[12],

式中:X為信號樣本;D 為字典;A 為在字典D 上信號樣本X 的線性組合,且A 為稀疏性,即其中的非零項只有幾個或個數遠大于為零的項數。在許多圖像處理或對象分類研究中已證明稀疏表示用于信號樣本重構相當有效。
1.1.1 字典初始化
在字典學習訓練中,有學者提出K-SVD 算法,每個信號找出一個完備字典D 使得X≈DA 成立。X 為一個n維度特征向量空間中的N個輸入信號,表達式如下[13]:

在K-SVD 中通過固定第K 項迭代運算解算式(1)的問題:

式中:D = [d1,d2,…,dK]∈Rn×K是學習訓練出的字典;A = [a1,a2,…,aN]∈RK×N為輸入信號X在稀疏表示中的線性組合;T 為非零系數的期望數即稀疏程度式(3)可等價表示為

式中:ε是字典學習時的可容忍誤差。
1.1.2 字典學習
在求解式(3)的等價問題上,有學者使用正交匹配追蹤算法(Orthogonal Matching Pursuit,OMP)。OMP是一種貪婪式算法,在每次迭代過程中使用貪婪迭代的方法可以減少重建中的錯誤。每次迭代時,OMP 從字典中選出一個最相似的基礎向量,通過該向量投影后計算出新的余差值用來更新字典,根據已知信號X與字典D計算出最佳的稀疏表示α,即[14]:

K-SVD算法以兩階段來學習過完備字典:①為稀疏編碼階段。固定字典,用任一種追蹤算法來求解;②更新字典和稀疏系數階段。K-SVD的迭代流程如圖1所示。

圖1 K-SVD算法迭代流程圖
初始字典可由過完備基礎向量集或觀測數據本身的原子獲得。基于初始字典D,通過OMP 算法用式(3)將每個αi優化,并允許每項系數向量擁有不超過T個非零系數元素來固定字典D。接著利用OMP 算法求出稀疏表示A 與已知輸入信號X 更新字典D 中每列dk的值,另外為稀疏表示A中的第k行,非零值的表示輸入信號X與dk間的線性組合關系。因此,式(1)可改寫成[15]:

式中:

dk和更新值可以通過求解式(6)得到:

K-SVD算法使用奇異值分解(SVD)將Ek進行矩陣奇異值分解,尋找進而更新dk。
為了解決SRC中字典不全等問題,有學者提出了CRC,并與概率子空間進行結合,將SRC 中的約束條件進行替換,得到如下的目標函數[16]:

式中:λ為概率協同系數。
相比SRC,概率CRC 具有字典數量少、計算速度快以及識別率準確等優點。
本研究在概率CRC的基礎上,使用稀疏表示系數來增強概率協同表示系數的稀疏性,此時的目標函數:

式中:前兩項表示協同表示項;第3 項表示稀疏增強項;γ為平衡參數。
針對本研究的算法流程,首先計算出表示系數,即利用K-SVD和OMP 算法得到表示系數,特別是稀疏表示系數γ,隨后根據字典學習對測試樣本重新分類,具體流程如下所示:① 給出訓練樣本矩陣X、字典D,以及在字典D上信號樣本X 的線性組合A。② 通過式(8)和(9)求得λ 及γ。③ 對目標函數進行最優化求解,更新字典,從而獲得圖像的標準特征標簽。
針對本研究建立的人臉辨識算法,需要測量標準評估算法,人臉圖像數據庫能夠提供在不同環境變化下的人臉信息,通過光源、表情、年齡等臉部的變化,建立起一個復雜的人臉辨識系統。完整的數據庫會提供標準的測試流程,對于樣本可定義為三部分:訓練組(Train Set)代表提供系統用來訓練特征空間;注冊組(Target Set)使系統定義對象類別;測試組(Query Set)用來評估系統效能。本研究選擇FERET、Multi-PIE、FRGC 3 個常見的國外人臉數據庫評估人臉識別算法的性能,三者在實驗測試上都有包含光源變化、表情。通過以上3 個數據庫來考慮本研究的人臉識別算法在不同光源條件下的效果,同時與傳統的稀疏表示算法進行對比,表1 為3 個數據庫的基本參數。
將數據庫的原始圖像縮放成30 ×30 大小,組成900 像素的圖像矢量。同時隨機選擇4 幅表情不同的圖像作為訓練樣本,其余為測試樣本。試驗重復10次,分別記錄識別準確率及標準差。算法設置的參數如下:SRC設置的誤差限為小于0.05,CRC 的正則化參數設置為0.001,K-SVD 和OMP 的稀疏度設為20,字典的個數設置為50 個。另外,將本算法和稀疏增強協同表示分類算法(SA-CRC)的稀疏度設置為40,同時誤差限小于0.02。

表1 3 個國外常見的人臉數據庫基本參數
FERET人臉數據庫是由美國軍方FERET 項目創建,所采用的樣本是3 年間分15 個時間點收集的1 199 個人,影像張數為641 126,數據庫的測試樣張如圖2 所示。在本研究中將本算法與其他6 種算法的識別率和標準誤差結果進行對比,如表2 所示。為描述結果方便,用算法的英文簡寫代替。

圖2 FERET數據庫測試樣張

表2 FERET人臉數據庫中各算法對比結果分析
從表2 可以看出,本研究算法的識別準確率最高,相比最低的OMP 識別率提升了近10%,與經典的CRC與SRC算法相比,識別準確率也有不同程度的提升,驗證了本算法在FERET人臉數據庫中識別的準確性及有效性。
CMU Multi-PIE人臉數據庫最早由美國卡耐基梅隆大學創建,注冊人數達337 人,不同于FERET 數據庫,其考慮多種角度、表情、光源變化,每個人有15 種角度變化及19 種光源條件,紀錄時間分為4 個Sessions,每個Session 的被拍攝人不相同,且拍攝者也有不同表情設定,測試樣張如圖3 所示。同時將本算法與其他6 種算法的識別率和標準誤差結果進行對比,如表3 所示。

圖3 Multi-PIE數據庫測試樣張

表3 Multi-PIE數據庫測試分析結果
從表3 可以看出,本研究算法的識別準確率超過95%,識別精度最高;最低的仍為OMP算法,識別準確率不到90%。相比經典的CRC 與SRC 算法,本研究算法的準確率提升顯著,這與算法中加入稀疏增強系數直接相關。因此,本算法在Multi-PIE人臉數據庫中識別的準確性及有效性都有顯著提高。
FRGC人臉數據庫收集來自美國諾特丹大學(University of Notro Dame),數據庫的拍攝共分為4 個session,其中接受拍攝者的對象參加其中1 ~4 個session不等,每個學期中會挑數個時間點進行拍攝。FRGC與Multi-PIE人臉數據庫的相同之處在于FRGC的拍攝環境是通過環繞攝影機進行瞬間拍攝,所以每個人在影像中的姿勢均是固定的,且光源變化也都一致。同時,在光源變化下FRGC 也較貼近一般日常生活情況,故對于人臉辨識來說具有一定挑戰性。FRGC人臉數據庫的測試樣張如圖4 所示,將本算法與其他6 中算法在FRGC 人臉數據庫中進行測試對比,結果如表4 所示。

圖4 FRGC人臉數據庫上的測試樣張

表4 FRGC人臉數據庫的測試分析結果
從表4 可以看出,本研究算法的識別準確率超過其他6 種算法,識別準確率相比傳統的SRC與CRC算法均提升顯著,同時由于FRGC 人臉數據庫的辨識難度性高于前面兩種,因此,整體算法的識別準確率有所下降,但本研究算法的準確率仍然接近94%,再次驗證了本算法的準確性。
由于SRC能夠有效改善影像對于光源、表情及遮蔽的情況,因此在圖像識別特別是人臉識別技術領域中得到了廣泛應用。本研究基于SRC 將概率協同表示分類算法與SRC結合,并利用稀疏表示系數增強概率系統表示分類算法的表示系數,進而提高算法的識別準確率及有效性。通過FERET、Multi-PIE 與FRGC人臉數據庫實驗測試結果對比可以看到,本研究提出的稀疏增強概率協同表示分類算法能夠顯著提升人臉識別的準確率,相比其他傳統分類算法的識別準確率均有一定程度提升。可見,本研究算法在不同的人臉識別情景中具有廣泛應用價值。