史豫坤 張大秀
摘要:通過加入差異度參數(shù)優(yōu)化了PAC,IDA,LBP等算法,采用漢明距離選取特征,并對樣本進行分析,得出類內矩陣和類間矩陣,利用算法把一個人的兩個圖像向量的差降維,取二范數(shù)來加以區(qū)分并計算正確率,然后淘汰正確率低的差距參數(shù),從而得到更高的正確率。主要步驟是:以二進制方式將圖片以多階灰度圖表示,然后進行像素點運算,統(tǒng)計有效像素點,運用優(yōu)化的算法,得出相似指數(shù)并分析出判定是否為不同時期同一人。提出的方法對一個人在理想狀態(tài)下不同時期的兩張照片的相似度高達95%以上,即對人臉相似度檢測具有顯著效果。
關鍵詞:差異度參數(shù);散度;漢明距離;降維;特征提取
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)04-0153-03
1 概述
人臉識別是從二十世紀中后期一直研究討論的問題,人臉識別的基礎是人眼對于人臉儲存與識別的生物理論,是基于人的面部特征信息進行身份識別的一種生物識別技術。目前,基礎的研究方法都是基于統(tǒng)計學的研究方法,即采集大量的信息,對這些信息進行分類,用某一種類中“共有”的統(tǒng)計特征來判斷某一信息是哪一個種類[1]。但判斷的標準不同,結果也就不同,比如定義一個特征為紅色特征,先觀察到一個信息中有紅色,但紅色只有20%,那么該不該判斷它就屬于紅色種類呢?這時可以采用機器學習的方法,把這個判別特征的差異度量化。通常,定義紅色比例大于30%是紅色種類,然后與定義紅色比例大于40%是紅色種類的差異度進行比較舍棄正確率低的差異度。但在識別時,真正把圖片向量化,可能每一個維度都有一個差異度,或者采用一些變換會增加計算速度和準確率,那么每次變換時的系數(shù)也是一種差異度;故本文設置一個約束條件,只對標準光照情況下(即理想狀態(tài)下)的人臉進行識別提取計算相似度。即兩個向量的差的二范數(shù),首先本文把兩個組所有圖片打亂進行重組,每組兩張照片,記為一個pair(不進行交叉打亂,即原來組還是原來組,只是進行重組成pairs 時,每一個pair中兩個照片不一定是一個人的),一個pair中兩個圖像向量的差就是一個樣本,全體樣本中一共有兩類,一類是“是同一個人”樣本,一類是“不是同一個人樣本”[2]。
假設人臉在這些低維線性空間的散布矩陣投影具有可分性,所以它可以對圖像光照條件引起的灰度變化判斷兩張不同時期階段的人臉是否為同一個人[3]。若人臉的特征為D維空間的特征,且本文需要從更高的維度空間(2D)中計算出協(xié)方差矩陣,在大量獨立樣本測試訓練數(shù)據中,判斷是否能得到更高效率的運行結果[4]。
PCA算法可以將圖像的隨機變量認為是分布規(guī)律的,從而得到人臉圖像分布的主要成分的方向;LBP算法可以較好的分析圖像的紋理特征;低頻傅里葉變換可以通過時空域和頻率域對圖像的信息提取分析;Gabor小波變換可以保持著人臉固有的形態(tài)、面部表情以及遮蓋物體的某些特性[5]。LDA算法可以大大降低原來圖片模式的維數(shù),從而很好的解決了子類內散布矩陣奇異問題[6],子空間算法的產生,對求解矩陣的逆有了新的改進。
2 特征提取
由于只能比較兩者是不是一個人,前提為確定的兩張圖片皆為固定姿態(tài)及光線情況下人臉,故不用考慮人臉定位。本文每一個人的的面部圖片只有兩張,通過一張圖片的信息與另一張圖片對比判斷是否為同一個人。設 是關于特征向量 X(這里 “是同一個”, 為“不是同一個”)的散度定義如下:
P 為 ,的先驗概率,即為關于事件 的古典條件概率。由統(tǒng)計學知識得: 1)不同特征相關性越低越好;2)特征選擇使散度越來越大。其中散度也可以簡單認為與 和 的差距成正比,故定義為:
使得 R 越大的特征 X 越具區(qū)分性,對于不同的 X 進行實驗(比如灰度分布,人臉輪廓,眼臉比例,特征值特征向量,奇異值,等密度線等等)然后選出最佳的 m 個特征 做參數(shù)化處理即作參數(shù) 作為衡量對應特征的差距度,即 。
3 算法實現(xiàn)
3.1 整體的低頻傅立葉變換
二維離散傅里葉變換(DFT):
其中x,y為M*N像素中(x,y)點的像素值,取低頻向量 為維向量,判斷一個pair
其中為參數(shù),這里的也可以通過,求得,可以減少參數(shù)的維數(shù)。
3.2 子空間算法
3.2.1 PCA算法優(yōu)化
先將本文的樣本按之前的分成兩類,即“是同一人類”與“不是同一人”類。由于PCA與LDA算法可以把中每一個樣本看作是一對圖像,故本文將這兩個圖像向量“相減”,即對應像素的灰度做差,形成一個圖像,這時可以區(qū)分與的特征不會變化很大。這樣中每個樣本都只是一個圖像(M*N像素)。
PCA算法的具體流程為:
① 假設中有個樣本,每個樣本為M*N圖像,可視為一個M*N維向量。
② 可以計算的均值
與散布矩陣
③ 計算出的特征值與特征向量,將特征向量,按大小順序排列。當小的特征值對應的“空白區(qū)域 ”去掉后,臉將變大,即臉的輪廓更接近邊界。只取前m個特征值與對應的特征值向量,則原樣本圖像在m維空間上的前m個投影坐標表示如下:(i=1,2)。
故PCA可以起到更好的降維效果,此時特征取:,則該樣本為類。其中,分子中的是在基下的前m個坐標,分母中的是在基下的前m個坐標。
3.2.2 LDA算法優(yōu)化
在PCA中可以通過改變基的選取來改變投影方向,不同的投影方向決定不同的特征,由前面散度的定義知,這些特征對于區(qū)分樣本類別具有強弱之分。那么通過LDA找到最佳區(qū)分特征,即最佳投影與最佳散度。
定義:樣本類內散布矩陣
樣本類間散布矩陣:
其中,為樣本,為類均值,為所有樣本均值。若樣本足夠大,使得為非奇異矩陣,則投影矩陣P滿足,即
令推倒出特征X,即,為參數(shù)。
3.3 局部算法
3.3.1 LBP算法優(yōu)化
LBP算法是一種局部算法,即它考慮的不再是整個人臉的特征,而是對每一點附近的灰度與自身進行比較。如果把整體特征看做頻率變化后的低頻段,局部的特征就是高頻段。對于區(qū)分像素高的pair圖效果更好,雖然在原問題中不考慮拍照光線與旋轉但在進行敏感度分析中,隨著拍照光線與照片角度的加入,會使其他算法效率降低,近而LBP算法的權重增加。由于LBP算法與整體灰度、旋轉都無關。
LBP算法步驟如下:
a. 將M×N的圖像分為不重疊的C塊,每塊P個點,在一般操作中,多分為3*3的小塊,每一塊的中心點為C,其余共有p-1個點。
b. g是除中心外第p個點的灰度,為中心處的灰度定義:
其中,就為LBP變化后的圖像,這時每個非中心點的灰點只為0或1。a中可以用圓形區(qū)域代替3*3塊,可以得到半徑為R的圓形域中P個點的LBP變換,即
LBP優(yōu)化的具體做法為:將上述圓形域進行旋轉得到的中心點和灰度的最小值,即為優(yōu)化后的LBP變換。這時,LBP的旋轉就不變了,進行完LBP變換后,再進行PAC或者LDA都簡化了,且受光線影響變小了。
3.3.2 Gabor 小波變換
Fourier變換是對圖像進行空間點,到頻點的整體變換,受拍照光強影響較大,故考慮光強,利用局部受影響較小的Cabor小波變換
其中,為中心頻率與方向,這里應選取多個進行變換,,都為參數(shù),當越大時,越可以體現(xiàn)局部性質,即波的高頻越突顯。
一般取。
設為圖像點(x,y)的灰度,則關于的Gabor特征為:,則Gabor與選取小塊(局部),不同取值相互獨立,即這個特征為一個,不妨,就為一個10的四次方數(shù)量級的向量,維度過高便直接計算,且本文假設先忽略光照,故只利用整體算法即可。
4 實驗數(shù)據分析
4.1 部分數(shù)據
本文采用10張明星照片對本文提出的整體特征進行對比檢測的400組數(shù)據如圖1所示:
4.2 實驗數(shù)據分析
通過分析實驗數(shù)據表明,在標準位置和標準光照環(huán)境下,如果兩張照片的相似度指數(shù)大于64.54122%,則可認定為這兩張照片就是同一人的照片。在理想狀態(tài)下的實驗數(shù)據表明,同一個人的不同時期的兩張照片,它們的相似度高達98.229834%。不同人的兩張照片,其相似度不超過61.63846%。在這10張照片中,利用本文提出的整體特征對比發(fā)現(xiàn),其中T1o的原圖與整體特征提取圖如圖2與T1y的原圖與整體特征提取圖如圖3所示的對比,從圖1中可以清楚地看出同一個人不同時期的對比檢測相似指數(shù)是98.22%。
5 總結
本文主要采用漢明距離選取特征,并對樣本進行分析,得出類內矩陣和類間矩陣,利用算法把一個pairs的兩個圖像向量的差降維,然后取二范數(shù)‘0,‘1來加以區(qū)分并計算正確率,然后淘汰正確率低的差距參數(shù),從而得到更高的正確率。運用優(yōu)化過的算法用Java編程進行實踐,得出相似指數(shù)進行分析判定是否為不同時期同一人。實驗表明:該方法可以準確地判定在理想狀態(tài)下同一個人不同時期的相似度,但是對于其他光照面部不清晰的圖片的判斷不是很準確,所以該方法還要繼續(xù)研究完善。
參考文獻:
[1] 陳奇毅. 淺析人臉識別技術的現(xiàn)狀和發(fā)展趨勢[J]. 通訊世界,2015(13).
[2] 汪亞菲,張迎獻.試析人臉識別技術的方法與應用[J]. 電腦編程技巧與維護,2014(15)
[3] 劉篤晉,孫淑霞,李思明.人臉識別中光照處理方法的分析[J]. 計算機系統(tǒng)應用,2011(1).
[4] 黃敏.常見人臉識別技術及其設備應用[J]. 電子世界,2014(12).
[5] 方程.人臉識別技術研究[J].信息技術與信息化,2014(11).
[6] 劉小軍,王東峰,張麗飛. 一種基于奇異值分解和隱馬爾可夫模型的人臉識別方法[J].計算機學報,2003(13).