紀姝伊
(長春理工大學 計算機科學技術學院,長春 130022)
當前,各種現代科技快速發展,人們獲取圖像的方式也更加的便捷,在此基礎上,人臉的識別技術也有了長足的進展[1-3]。在近幾年,對人臉識別的研究,大多數是使用深度學習類的方法,該類方法具有很好的識別性[4-5]。這主要是針對人的面部識別方面進行的研究,以人工神經網絡作為基礎創建的,當前的深度學習手段已經比較普及,而且具有很高的識別度。這種識別手段主要來自人工的神經網絡系統,通過對人的大腦進行模擬分析進而建立相關的數據,仿照人的大腦對相關圖像參數進行解析,這是一種無需監督的學習手段。深度學習有比較多的方法,卷積神經網絡就是簡稱為CNN的一種深度學習手段,這種學習方法使用的比較多,因為它的網絡模型比較簡單而且具有自動化的識別數據,不過對于人的面部辨識方面來說很多經典的手段還是值得更加深入的研究的,比方說是參數的降維解析算法,本文主要對以稀疏表示為基礎的圖嵌入降維解析算法進行更加深入的分析,進一步使面部識別時辨識度得到提高。
表情圖像的預處理包括表情圖像子區域的分割以及表情圖像的歸一化處理,前者指從表情圖像分割出與表情最相關的子區域,而后者包括圖像的灰度均衡和尺度歸一。圖像預處理的好壞直接影響表情特征提取的效果和計算量。
通過小波變換處理后,變換特征的維數有了明顯的提高,因此,在整個實驗的過程中都通過均勻下采樣方法來處理Gabor小波,以此來實現降維。表情特征提取可分為兩步:歸一化后的表情圖像的網格化和彈性圖的構造。
小波變換后生成的特征矢量模較大。針對上面分割及歸一化后的表情子圖像,首先對表情子圖像進行網格化處理,即使用固定尺寸的網格進一步分割表情子圖像。識別時采用彈性圖匹配算法,通過適當改變表情模板的網格結點間距離,找到表情模板與待識別表情圖像的最佳匹配,從而實現表情的分類與識別。
本階段的任務是將經網格化后的人臉子圖像轉換為表情特征彈性圖(或稱作表情屬性拓撲圖)。即對人臉子圖像的每一個網格進行Gabor小波變換,取變換后的小波系數作為該網格的特征矢量,所有網格的特征矢量則構成了表情特征彈性圖。
通過SR-Graph方法來進行模型的建立,尋找樣本點Xi的鄰近樣本點。采用歐氏距離作為測度來尋找每個樣本點Xi的k個最近鄰的樣本點。可用Xn來表示這k個最近鄰的樣本點組成的集合,求解樣本點間的權值矩陣權Wij,表示第j個樣本點對重構第i個樣本點的貢獻,當兩個數據點越相近時,兩者之間的權值也就越大。該方法的特點有兩個方面:一是使用SR-Graph方法,能夠在降維的過程中保持很好的魯棒性,能夠盡可能的保證不依賴參數;二是能夠同時確定權值和圖邊,進而能更容易的建立優良模型。
借助Matlab手段進行相關的仿真模擬,進而更好的對前文提出的以稀疏表示為基礎的圖嵌入降維解析算法進行解析,下面選取PIE參數存儲空間里的少量Pose-05作為示例,選取示例遵循以下準則:首先是選擇第一個人的第二張圖片作為測試示例,以隨機選擇的十個人中的前面二十張照片作為訓練示例的集合(不包括測試示例),所說的字典指的就是它,下面的圖1表示的是用字典以稀疏表示的手段進行測試示例分析從而得到的所有參數圖像,字典里面除了零以外的參數相對應的原子情況也在圖中。通過實驗能夠得到:圖里面有五個參數是非零的,它們是1號、4號、11號、15號、17號,與之相對的原則參數是這些非零系數所對應的原則數值,為0.008,0.2103,0.0297,0.0923,0.6435。除去非零的參數以外,還可以知道有不是絕對零值的參數,之所以這樣是因為這些數據都比較小,影響不大,可以忽略。其次,使用以上非零參數相對的結果圖片進行二號測試圖片的再一次構造時,重構的殘差十分小,這就表示之前選取的樣本中已經具有二號圖像的參數。所以,能夠在訓練樣本的集合中直接將二號圖像刪除。

圖1 2號圖像稀疏表示后的系數及其對應的圖片
圖2表示的是二號樣本相對別的樣本的歐氏距離,本文為了將結果比較明顯的表示出來把前面三十個距離進行了增大,可以參見圖3。
通過圖2展現的二號測試圖片相對全部訓練樣本的歸一化距離,能夠發現二號的歸一化距離相對別的樣本而言比較小。

圖2 2號測試圖像與所有訓練樣本的歸一化距離

圖3 2號測試圖像與前30個訓練樣本的歸一化距離
通過圖3能夠發現:對于之前提到的非零參數對應的圖像以及二號測試樣本來說,它們的歐式距離全都相對小得多,不過這并不能說明其稀疏數值大小不為零,比方說11號圖像,通過稀疏表示選取的樣本相對通常根據距離選擇樣本的不同之處就在于此,同時也就比較好的表示稀疏描述在人大腦的主觀感知表示參數的具體情況。
本文主要使用ORL免費的人臉存儲空間對以稀疏表示的圖嵌入降維解析手段進行效果檢驗。本文使用的以稀疏表示為基礎的圖嵌入降維解析算法,主要是兩個可以變化的參數,它們是:重構殘差閾值λ以及稀疏表示的系數閾值μ。此次測試再一次選擇隨機的樣本集合(不能選擇前一次已經選取的樣本),測試的條件同前一次測試一樣,一個小組要做十次平行測試,以十組測試的平均值作為辨別度。假設確定的數值λ大小為0.145,通過變換稀疏表示的系數閾值,分別獲得在稀疏閾值不一樣時的辨識度以及壓縮好壞。得到的相關數據參見下面的表格1和2。
如表1所示,從ORL人臉數據庫中λ=0.145時的識別率中可以看出,本文提出的基于稀疏表示的圖嵌入降維算法在ORL人臉數據庫中λ=0.145時具有比較好的識別率。
通過表2里的相關數據,能夠發現當選取的樣本數量越多的時候,稀疏表示的系數閾值就會隨之增大。對于ORL參數存儲空間來說,每一個人都會有一張不同的面部表情圖片。能夠將這些圖片作為訓練的樣本,因為上面的三種非負矩陣的解析方法全部是無監督的解析手段,也就是說,能夠以不同的類別為依據迅速地找到相關的訓練樣本。緊接著,對其做降維操作,進而將維度較高的面部圖片換算成維度較低的參數。

表1 ORL人臉數據庫中λ=0.145時的識別率(%)
以稀疏表示為基礎的圖嵌入降維解析的面部辨識流程如圖4所示。第一就是要提前對測試以及訓練的相關圖片進行處理,其次就要通過Gabor的小波變換獲得圖片里的表征性參數,緊接著用以稀疏表示為基礎的圖嵌入降維解析手段得到需要的面部辨識結果。

表2 ORL人臉數據庫中λ=0.145時的選樣樣本數

圖4 稀疏表示的圖嵌入降維算法的人臉識別過程
人臉識別的使用會受到光照以及障礙物等諸多條件的影響,這些外在因素會對實際使用面部識別時造成很大的影響,進而導致分辨率下降。通過對前人的成果進行分析以及自己測試的基礎上能夠知道:對于人的面部識別來說,以稀疏表示為基礎的解析算法具有自身特殊的優勢,當面部識別受到光照以及遮擋的時候,其展現了令人滿意的魯棒性以及優越性。因此,在圖嵌入的降維解析算法里引進稀疏表示的手段可以增強識別率。
[1]王心醉,郭立紅,楊麗梅,等.基于AdaBoost的人臉檢測算法[J].長春理工大學學報:自然科學版,2009,32(2):248-250.
[2]李陽.基于三維模型子空間監督學習法的二維人臉識別[J].長春理工大學學報:自然科學版,2009,32(3):442-446,435.
[3]胡建軍.稀疏表示在人臉識別中的應用[D].長沙:中南大學,2014.
[4]張其文,莊新磊.基于監督協同近鄰保持投影的人臉識別算法[J].計算機科學,2015,42(5):309-314.
[5]丁正明.流形學習方法在視頻人臉識別中的應用基礎研究[D].成都:電子科技大學,2013.
[6]邢云.基于壓縮感知理論的人臉識別方法研究[D].大連:大連理工大學,2010.
[7]張翠萍,蘇光大.人臉識別技術綜述[J].中國圖像圖形學報,2000,5(11):885-894.
[8]鄧承志.圖像稀疏表示理論及其應用研究[D].武漢:華中科技大學,2008.
[9]郭志強.基于子空間分析的人臉識別算法研究[D].武漢:武漢理工大學,2010.
[10]張春梅,尹中科,肖明霞.基于冗余字典的信號超完備表示與稀疏分解[J].科學通報,2006,51(6):628-633.