陳秀端
(漳州職業(yè)技術(shù)學(xué)院機(jī)械工程學(xué)院,福建 漳州 363000)
隨著社會(huì)信息化的飛速發(fā)展,人類(lèi)越來(lái)越重視信息安全。在眾多的生物識(shí)別技術(shù)中,人臉識(shí)別技術(shù)應(yīng)用廣泛,易被受檢者接受。
近年來(lái),人臉識(shí)別技術(shù)飛速發(fā)展[1],Turk與Pentland提出PCA(principal component analysis),用于提取人臉圖像的主要特征,是早期人臉識(shí)別技術(shù)的基礎(chǔ)[2-5]。Gabor算法進(jìn)行特征提取之后數(shù)據(jù)量太大,不利于復(fù)雜圖像的信息提取[6]。本課題通過(guò)對(duì)Gabor小波變換算法與PCA主成分分析算法的分析,先用Gabor分解圖像提取特征再濾波,再用PCA降維,最后進(jìn)行實(shí)驗(yàn)設(shè)計(jì)和驗(yàn)證。結(jié)果表明,相比于傳統(tǒng)的PCA算法,Gabor與PCA融合算法的人臉識(shí)別技術(shù),識(shí)別率提高了。
小波是指幅值為0,具有一定長(zhǎng)度的極小區(qū)域的波形。“小”顧名思義是指波形的衰減性,“波”形象地描述了波形的波動(dòng)性[7]。由于傅立葉變換的缺陷是不能隨頻率變換的,而Gabor提供的這種變換窗口可以隨頻率而改變時(shí)域-頻域。運(yùn)用窗函數(shù)g(t-τ)乘以信號(hào)函數(shù)f(t),實(shí)現(xiàn)了τ周邊的開(kāi)窗。

從式(1)可以看出,Gabor測(cè)量的是在τ附近的小區(qū)域內(nèi)的頻率,是ω的正弦函數(shù)分量的幅度。窗函數(shù)g(t-τ)是高斯函數(shù),經(jīng)過(guò)傅立葉處理后仍是高斯函數(shù),這就使得在小窗口內(nèi),在時(shí)域-頻域上,傅立葉變換具有局部化的作用,如果窗口函數(shù)ga(t)這樣定義:

這樣,小窗口寬度就由參數(shù)a決定,把式(2)代入
式(1)進(jìn)行傅立葉處理再積分,得出它的頻譜公式:

可見(jiàn),通過(guò)傅立葉變換分解了f(τ)的頻譜F(w),從而得到了信號(hào)的局部信息[8]。如果τ在時(shí)間軸上平行移動(dòng),可得出傅立葉計(jì)算公式:


當(dāng)f(x)=y(x)時(shí):

│f(x)│是f(x)的函數(shù)。用角頻率的變化量r替代時(shí)間的變化量t,同時(shí)用頻域的窗口函數(shù)G(r-ω)替代時(shí)域的窗口函數(shù)g(t-τ),可得頻域ω周邊的局部信息:

所以,Gabor小波變換的基本原理是:只要選取的小窗口在時(shí)域-頻域的局部性質(zhì)良好,就能夠運(yùn)用Gabor變換原理準(zhǔn)確無(wú)誤提取到時(shí)域-頻域信號(hào)F(t)的特征信息[9]。
PCA是以K-L正交變換為基礎(chǔ)的算法,再運(yùn)用奇異值分解計(jì)算法壓縮數(shù)據(jù),提取人臉圖像特征信息[10-11]。下面介紹K-L正交變換與奇異值分解算法。K-L正交變換是生物識(shí)別領(lǐng)域中最常用、最熱門(mén)的算法,由Kirby等科學(xué)家提出,研究上常用K-L處理過(guò)的識(shí)別圖信息替代原來(lái)識(shí)別圖的信息。多數(shù)實(shí)驗(yàn)證明,K-L是一種壓縮圖像信息的最佳處理方式,依照統(tǒng)計(jì)學(xué),K-L正交變換可以找到最小的信息。
設(shè)被識(shí)別圖像是二維灰度圖f(x,y),若用M維向量表示,則圖像訓(xùn)練集就可以看成是N維的隨機(jī)變量。Xi表示訓(xùn)練集中第i個(gè)樣本的圖像矢量,所以訓(xùn)練集中的樣本總數(shù)為M,則M維向量平均值為:

所以,訓(xùn)練樣本圖的協(xié)方差矩陣為:

K-L變換后的矩陣為:

式中,P表示訓(xùn)練集里的總?cè)藬?shù),μi是第i個(gè)人圖像的平均矢量。從式(9)、式(10)可以看出,通過(guò)K-L正交變換后,識(shí)別圖像維數(shù)降低了,由M-1降到P-1,大大地減少了計(jì)算量,但識(shí)別率并未下降,下文通過(guò)實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證。
以N×N的識(shí)別圖像為例,其中Cb矩陣的維數(shù)是N2×N2,難于通過(guò)計(jì)算直接得出其特征信息值和正交歸一化矢量。
改進(jìn)這一不足可用奇異值分解(SVD)算法。用X表示n×r維矩陣,秩為r,這樣就有以下兩個(gè)正交矩陣:

對(duì)角矩陣:

λ0,λ1,…λr-1以降序的方式排列:λ0≥λ1≥…≥λr-1,所以有。
式中,λ1是矩陣XXT和XTX的非零特征值,ui、vi分別是XXT和XTX的特征矢量。這就是矩陣X的奇異值分解算法(SVD),λ1是X的奇異值[1]。
SVD推導(dǎo)過(guò)程如下:

其中:

矩陣特征矢量λ1和相對(duì)于它的正交歸一化后的特征向量vi很容易求得。
由上面可得,正交歸一化后,Cb的特征矢量如下:

ui就是識(shí)別圖像的“特征臉”的矢量,標(biāo)作:
p(p<M),人臉識(shí)別時(shí)P個(gè)特征值實(shí)際上已經(jīng)夠用了。所以在計(jì)算特征臉時(shí),只需要取M中前面的P個(gè)最大特征值所對(duì)應(yīng)的特征向量。對(duì)于隨機(jī)的一個(gè)人臉識(shí)別圖X,對(duì)特征圖像的子空間進(jìn)行投影,該投影就是向量X與U的內(nèi)積:

Gabor和PCA融合算法流程圖如圖1所示,具體算法步驟如下:

圖1 Gabor和PCA融合算法流程圖
1)選用并輸入ORL數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)訓(xùn)練圖。
2)選用光照預(yù)處理、標(biāo)準(zhǔn)化處理、圖像增強(qiáng)等預(yù)處理算法,選用窗口為5*5的方形中值濾波器。
3)Gabor變換與提取,在范圍[0,π]內(nèi)采樣,選取8個(gè)方向、5個(gè)尺度,得到40個(gè)分量。
4)PCA降維,用PCA主成分分析法對(duì)特征圖像信息進(jìn)行數(shù)據(jù)壓縮、降維[12]。根據(jù)前面的算法闡述,特征臉圖像的特征維數(shù)是M,經(jīng)過(guò)K-L變換后,得到矩
成分分析算法降維。接著采用PCA算法是對(duì)特征臉進(jìn)行降維。根據(jù)前文的研究算法,設(shè)有特征維數(shù)為M的人臉圖像,則:K-L變換后產(chǎn)生矩陣可得到,根據(jù)SVD定理,對(duì)任意人臉圖像X,將其向特征臉子空間投影,得到列向量。然后使用基于歐氏距離的最近鄰分類(lèi)器,將特征臉對(duì)應(yīng)的人臉?lè)诸?lèi)出來(lái)。
2.2.1 識(shí)別系統(tǒng)實(shí)驗(yàn)流程介紹
本實(shí)驗(yàn)流程使用Matlab軟件,以Gabor與PCA融合算法作為核心算法,以此來(lái)提取特征的算法,能夠把人臉數(shù)據(jù)庫(kù)中的人臉識(shí)別圖像識(shí)別出來(lái),且準(zhǔn)確率大于95%,實(shí)驗(yàn)系統(tǒng)人為隨機(jī)選取數(shù)據(jù)庫(kù)中的圖像。選擇Gabor與PCA融合或是只有PCA這兩種算法,輸出實(shí)驗(yàn)結(jié)果。融合算法的系統(tǒng)流程圖如圖2所示。

圖2 融合算法的系統(tǒng)流程圖
2.2.2 Gabor與PCA融合算法識(shí)別系統(tǒng)實(shí)驗(yàn)的實(shí)現(xiàn)工具
實(shí)現(xiàn)工具選用Matlab,這是一款由美國(guó)MathWorks公司研發(fā)的軟件,在數(shù)值分析與數(shù)據(jù)信號(hào)處理、動(dòng)態(tài)建模與系統(tǒng)優(yōu)化、可視化的人工程序設(shè)計(jì)方面有廣泛的應(yīng)用。其編程和計(jì)算機(jī)速度快、效率高,簡(jiǎn)單易學(xué),人機(jī)交互強(qiáng)大,在應(yīng)用程序和圖像處理方面功能強(qiáng)大。
2.2.3 系統(tǒng)軟件主要界面
人臉識(shí)別系統(tǒng)軟件主界面如圖3所示,打開(kāi)圖像界面如圖4所示,識(shí)別過(guò)程界面如圖5所示。

圖3 人臉識(shí)別系統(tǒng)軟件主界面

圖4 打開(kāi)圖像界面圖

圖5 識(shí)別過(guò)程界面圖
2.2.4 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果分析
按照論文實(shí)驗(yàn)步驟,本節(jié)對(duì)Gabor與PCA融合實(shí)驗(yàn)算法的人臉識(shí)別系統(tǒng)進(jìn)行實(shí)驗(yàn)并提取數(shù)據(jù)進(jìn)行分析,與單純PCA算法的實(shí)驗(yàn)結(jié)果進(jìn)行比較。
實(shí)驗(yàn)圖像選用ORL人臉數(shù)據(jù)庫(kù),進(jìn)行算法驗(yàn)證。每個(gè)人有10幅圖像,選前5幅作為訓(xùn)練樣本,后5幅作為測(cè)試用樣本,分別各有200幅,實(shí)驗(yàn)數(shù)據(jù)如圖6所示。

圖6 兩種算法在不同特征臉維數(shù)下的識(shí)別率對(duì)比線(xiàn)
對(duì)比圖6中數(shù)據(jù)可知,把Gabor和PCA融合在一起的算法,其系統(tǒng)識(shí)別率大約提高了2%。Gabor算法在繼承和發(fā)展傅立葉變換的整體思想上有很大的優(yōu)勢(shì),能極大地提高識(shí)別系統(tǒng)的魯棒性和識(shí)別率。而PCA主成分分析法,先統(tǒng)計(jì)空間中現(xiàn)有的原始信息,分析數(shù)據(jù),篩選出最主要的特征信息,去除其他無(wú)用的信息,提高了信息利用率。實(shí)驗(yàn)設(shè)計(jì)中,先用PCA對(duì)數(shù)據(jù)降維。從圖6中數(shù)據(jù)可看出,從維數(shù)20開(kāi)始,維數(shù)增加,識(shí)別率隨之提高,但速度越來(lái)越慢;維數(shù)繼續(xù)增加,系統(tǒng)計(jì)算變得更加復(fù)雜,識(shí)別率提高的速度趨于緩慢,幅度很小。數(shù)據(jù)分析可以看出,在維數(shù)為50左右時(shí),識(shí)別率較高,能夠滿(mǎn)足系統(tǒng)要求。
本課題具體介紹Gabor與PCA相互融合的人臉識(shí)別系統(tǒng)的實(shí)驗(yàn)設(shè)計(jì)流程,運(yùn)用Matlab軟件實(shí)現(xiàn)了融合算法的實(shí)驗(yàn)仿真,進(jìn)行了實(shí)驗(yàn)設(shè)計(jì)并分析了實(shí)驗(yàn)數(shù)據(jù)。Gabor算法雖然具有較大的識(shí)別率和魯棒性,但計(jì)算量太大而致使效率降低;PCA是對(duì)數(shù)據(jù)進(jìn)行降維,再對(duì)映射到子空間的信息進(jìn)行分類(lèi)再識(shí)別,降低數(shù)據(jù)維數(shù)到50,減少了50%的計(jì)算量;最后把Gabor與PCA進(jìn)行融合算法處理,比起傳統(tǒng)的PCA主成分分析法,識(shí)別率大約提高了2%。