吳明 潘亞賓



摘 ? 要:人臉識別技術的應用背景越來越廣泛。目前將人臉識別技術應用到門禁系統(tǒng)多是基于單個攝像頭,其缺點是非授權的訪客可以通過使用授權用戶的正面照片來獲得訪問權限。為了應對這些在現實生活中可能會出現的問題,本文提出使用預先放置在多個角度的攝像頭,同時拍攝多張人臉圖像,再對這多張圖像進行處理,從而使系統(tǒng)可靠性更高。針對上述多張圖像同時進行人臉識別,本文提出了一種改進的聯(lián)合稀疏表示多圖像人臉識別算法。
關鍵詞:人臉識別 ?稀疏表示 ?算法
中圖分類號:TP391.41 ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2020)06(a)-0158-03
由Wright提出將稀疏表示用于人臉識別中[1]。與以往不同的是,其主要思想不是直接利用訓練樣本得到標準原子庫,再通過標準原子庫來構造字典,而是采用經過降維處理后的訓練樣本先得到原子庫,再通過此時的原子庫來構造字典。
首先定義訓練樣本矩陣(即構造字典),其中是C類別數目,假設任何一個第C類樣本都可以由上述的構造字典線性表示,則y可以由下列線性組合表示[2]。
由于實際圖像中常包括光照不均、噪聲干擾等問題,故由式(3)得到的2并一定稀疏且得到的解不唯一,即測試樣本不可能由訓練樣本精確地表示[3]。
為了盡可能減小識別誤差,本文通過對左側圖像同一人臉的多角度測試樣本采用對應的字典原子進行稀疏求解從而進行識別[4]。左側的每個圖像雖然都來自于同一張人臉,但是每張圖像中的人臉的位置卻有很大的差異,因此如果對左側的每張圖像進行稀疏表示,那么它們在字典內的原子級別必然是不同的,但是稀疏表示在字典內類別的級別上是相同的[5-6]。因此依據以上特性,就可以實現分類。
1 ?改進的聯(lián)合稀疏表示人臉識別模型
對于視頻監(jiān)控系統(tǒng),從多個角度去拍攝圖像,然后對這些多角度圖像進行處理,再通過分類準則進行分類就能夠得到比較準確的識別結果。假定有同一張人臉的M個不同角度的圖像,就能夠得到這些圖像所對應的稀疏表示。
將獲得的多角度圖像通過式(4)進行運算,就可以獲得每張圖像各自的稀疏表示,但是卻得不到它們之間的關系,如圖2(a)所示。為了獲得能夠表示各個圖像之間的關系的模型,因此引入聯(lián)合稀疏表示方法[7],如圖2(b)所示,聯(lián)合稀疏表示的主要思想是通過字典原子對多個同一樣本不同視角數據的輸入信號進行線性表示[8]。依據聯(lián)合稀疏表示這一思想,就可以通過式(5)對多幅圖像進行處理。
代表的是弗羅貝尼烏斯范數,表示的是混合范數,在聯(lián)合稀疏表示這一方法中,處理過程是:首先采用l1范數處理X行,再用l0范數處理前面的結果[9-10]。但是上述方法卻有很大的局限性,因為很難保證多角度圖像通過字典后,在字典內原子級別上的稀疏表示是相同的,因此本文在基于聯(lián)合稀疏表示方法的基礎上進行了改進,提出了能夠解決上述問題的算法,也就是這里的聯(lián)合動態(tài)稀疏表示算法,如圖2(c)所示。
2 ?聯(lián)合動態(tài)稀疏表示人臉識別算法
2.1 算法1 ? JDSR()
算法說明:在上式(8)中給出了識別人臉算法的模型,通過以下算法可以實現對模型的解。步驟如下:(1) 依據下文所提到的算法2來確定原子,也就是通過聯(lián)合動態(tài)稀疏匹配的算法來挑選出原子;(2) 依據當前原子及時調整矩陣I;(3) 依據更新了的矩陣I可以獲得對應的系數Z;(4) 通過此時的系數Z再來調整原子;(5)最后再調整殘差。如果條件滿足,將循環(huán)執(zhí)行以上步驟。用來代表第i列,用來代表第i行。
代表的是檢索矩陣,它由M幅圖像中L個最有代表性的動態(tài)數集所組成,其中每個動態(tài)數集都作為一行。基于以上的分析,在這里提出本文的第二個算法——聯(lián)合動態(tài)稀疏匹配算法。算法的詳細步驟如下:(1)通過字典原子標簽向量u和分類數c來推導出第i個分類的索引向量;(2)通過將分類數c和圖像的張數m代入到中進行不斷迭代,當Z取得最大值時所對應的v和t便是我們要得到的第m個圖像的第i個分類的最大系數v和檢索號t;(3) 由步驟(2)能獲得每個分類的最大系數,此時將每一類的最大系數都放在一起;(4)通過比較所有的類,從其中挑選出具有最大數集的類;
3 ?實驗仿真與結果
我們對多個角度的人臉進行識別,這里采用CMU人臉庫用多個攝像頭對人臉進行采集,
并分別設置角度為,對本文所采用的算法進行實驗。如圖3所示。我們從人臉數據庫CMU中選擇一張人臉,并將M值設為將d設置為64(圖像的像素),其識別效果如圖4所示。
將M設置為5,d設置為,得到不同像素下人臉的識別率如圖5所示。
4 ?結語
本文在聯(lián)合稀疏表示的基礎上進行了改進,通過對多角度圖像進行處理,避免了非授權訪客利用授權訪客的人臉圖像來獲得門禁權限的問題,從而極大地提高了門禁系統(tǒng)的人臉識別率,也消除了一些潛在的安全隱患,具有十分重要的現實意義。通過利用CMU人臉庫對本文提出的人臉識別算法進行仿真試驗,可以得出結論本文所提出的人臉識別算法明顯優(yōu)于其他算法。
參考文獻
[1] 虞濤. 基于低秩稀疏分解的遮擋人臉識別研究[D].南京郵電大學,2019.
[2] 朱韋丹. 基于多模態(tài)圖像融合的人臉識別算法研究[D].電子科技大學,2019.
[3] 羅宵晗. 基于稀疏表示的人臉識別方法研究[D].杭州電子科技大學,2019.
[4] Yan J, Zheng W, Xu Q, et al. Sparse Kernel Reduced-Rank Regression for Bimodal Emotion Recognition From Facial Expression and Speech[J]. IEEE Transactions on Multimedia, 2016, 18(7):1.
[5] Wang R, Liu L, Yang Z, et al. Construction of Manifolds via Compatible Sparse Representations[J].Acm Transactions on Graphics, 2016, 35(2):1-10.
[6] 項曉麗,武圣,龍偉,等.基于核的兩階段稀疏表示的人臉識別研究[J]. 測控技術,2016(8):20-24.
[7] 歐衛(wèi)華. 基于稀疏表示和非負矩陣分解的部分遮擋人臉識別研究[D].華中科技大學,2014.
[8] Liu L, Lao S, Fieguth P, et al. Median Robust Extended Local Binary Pattern for Texture Classification[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2016, 25(3):1.
[9] 沈學華,詹永照,程顯毅.基于樣本擴充的核稀疏表示的人臉識別方法[J].計算機工程與設計,2016(5):1357-1361.
[10]張建明,何雙雙,吳宏林,等.基于拓展稀疏表示模型和LC-KSVD的人臉識別[J].計算機工程與應用,2016(13):206-211.