左浩宇
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)
人臉識(shí)別一直是模式識(shí)別領(lǐng)域中的一個(gè)熱點(diǎn)研究問(wèn)題,其應(yīng)用場(chǎng)景也很多。例如,蘋(píng)果公司推出的人臉識(shí)別解鎖,攝像頭監(jiān)控中的人臉身份識(shí)別等,在商業(yè)及安全等都有著很重要的應(yīng)用。而隨著人們對(duì)人臉識(shí)別的精度與魯棒性有著越來(lái)越高的要求,如在一些極端惡劣的條件下有效的進(jìn)行人臉識(shí)別。在手機(jī)的人臉識(shí)別解鎖中,需要考慮人物的表情,面部裝飾等其他遮擋物帶來(lái)的影響;而在攝像頭的視頻中,需要對(duì)模糊的人臉進(jìn)行身份認(rèn)證。因此,人臉識(shí)別算法的研究受到了大多數(shù)研究者的重視。
快速高效的人臉識(shí)別建立在人臉區(qū)域內(nèi)的關(guān)鍵信息特征點(diǎn)的魯棒性檢測(cè)和定位上,其主要是結(jié)合計(jì)算機(jī)的視覺(jué)分析模擬人臉姿態(tài),實(shí)現(xiàn)對(duì)人臉信息的重構(gòu),結(jié)合特征信息對(duì)樣本進(jìn)行學(xué)習(xí)和訓(xùn)練,通過(guò)設(shè)計(jì)特定的分類(lèi)器對(duì)人臉特征進(jìn)行檢測(cè)和識(shí)別。目前較為常見(jiàn)的人臉特征提取方法即使用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)人臉訓(xùn)練并提取特征,再將提取的特征放進(jìn)其他模型中進(jìn)行分類(lèi)。
傳統(tǒng)的人臉識(shí)別方法分為單樣本的人臉識(shí)別與批量的人臉識(shí)別。例如主成分分析、神經(jīng)網(wǎng)絡(luò)訓(xùn)練,或者LBP特征提取方法等。與傳統(tǒng)的人臉識(shí)別方法相比,卷積神經(jīng)網(wǎng)絡(luò)以原始的圖像作為輸入樣本,在卷積的過(guò)程中一步步提取圖片的特征并整合,最后輸出每張圖片經(jīng)模型后的特征,其中減少了對(duì)訓(xùn)練樣本的處理工作,并通過(guò)模型的學(xué)習(xí)能力抽取特征,不僅僅減少了復(fù)雜的工作量,同時(shí)提取的特征用作分類(lèi)后也有著很好的效果。
昆明理工大學(xué)的趙顯歡等人[1]提出了多列深度卷積神經(jīng)網(wǎng)絡(luò),其目標(biāo)針對(duì)圖像分類(lèi)問(wèn)題專(zhuān)門(mén)設(shè)計(jì)的一個(gè)模型,增加了網(wǎng)絡(luò)的層數(shù),從而提高了網(wǎng)絡(luò)提取圖像特征的能力。構(gòu)造的多列深度神經(jīng)網(wǎng)絡(luò)模型由多個(gè)圖像預(yù)處理的3個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)組合而成共15個(gè)深度卷積神經(jīng)網(wǎng)絡(luò),將這些神經(jīng)網(wǎng)絡(luò)隨機(jī)構(gòu)成一個(gè)多列的深度卷積神經(jīng)網(wǎng)絡(luò)模型;張軍朝等人[2]提出采用人臉的姿態(tài)和神經(jīng)網(wǎng)絡(luò)相結(jié)合的人臉識(shí)別算法,其中人臉的姿態(tài)通過(guò)模型自動(dòng)校準(zhǔn),并減少了光照角度等不確定因素對(duì)人臉圖片的影響,增強(qiáng)了人臉對(duì)環(huán)境變化的魯棒性,最終采用隨機(jī)森林分類(lèi);王靈等人[3]提出了一種改進(jìn)Softmax分類(lèi)器的深度卷積神經(jīng)網(wǎng)絡(luò)的方法,利用一個(gè)回歸算法對(duì)網(wǎng)絡(luò)輸出的特征分類(lèi)并識(shí)別;黃超等人[4]結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)進(jìn)行人臉識(shí)別。首先,對(duì)人臉圖像進(jìn)行卷積和下采樣處理,處理后由支持向量機(jī)分類(lèi)識(shí)別;李淑[6]利用卷積神經(jīng)網(wǎng)絡(luò)處理視頻中的人臉識(shí)別,通過(guò)截取視頻中的幀,檢測(cè)當(dāng)前幀中是否含有人臉,并跟蹤人臉檢測(cè)是否有新的人臉加入;曹金夢(mèng)等人[7]搭建了一個(gè)雙通道卷積神經(jīng)網(wǎng)絡(luò),同時(shí)從人臉灰度圖像與對(duì)應(yīng)的LBP圖像中自動(dòng)提取特征,其中灰度圖像傾向于面部細(xì)節(jié)的捕捉,針對(duì)圖像不同特點(diǎn)調(diào)節(jié)網(wǎng)絡(luò)的參數(shù),利用Softmax進(jìn)行分類(lèi)。該網(wǎng)絡(luò)能夠自動(dòng)提取不同通道人臉圖像的特征,并進(jìn)行加權(quán)融合,從而給出較為準(zhǔn)確的表情識(shí)別結(jié)果。
上述研究學(xué)者都提出了一種在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)或者分類(lèi)器的模型進(jìn)行改進(jìn)的方案來(lái)優(yōu)化人臉識(shí)別的準(zhǔn)確率,故本文將卷積神經(jīng)網(wǎng)絡(luò)提取的特征作用在傳統(tǒng)的分類(lèi)器上,并觀察其分類(lèi)性能,分別使用支持向量機(jī)和樸素貝葉斯分類(lèi)器對(duì)網(wǎng)絡(luò)提取的特征分類(lèi)并比較這兩類(lèi)分類(lèi)器用作人臉識(shí)別的性能優(yōu)劣。
卷積神經(jīng)網(wǎng)絡(luò)是近年來(lái)的重點(diǎn)研究對(duì)象,其中,神經(jīng)網(wǎng)絡(luò)的思想來(lái)自于在對(duì)動(dòng)物的腦神經(jīng)研究其神經(jīng)元時(shí)發(fā)現(xiàn)腦中的獨(dú)特網(wǎng)絡(luò)結(jié)構(gòu)可以降低網(wǎng)絡(luò)的復(fù)雜度,并將其應(yīng)用在計(jì)算機(jī)學(xué)科中。目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為了最受歡迎的模型,特別是在圖像分類(lèi)領(lǐng)域,由于其避免了對(duì)訓(xùn)練集的預(yù)處理,從而可以簡(jiǎn)化工作流程,故被大多數(shù)學(xué)者應(yīng)用。
1.2.1 卷積層
卷積層即模型中專(zhuān)門(mén)抽取圖像特征的層,其一般由多個(gè)不同的卷積核構(gòu)成,卷積核卷積后生成特征圖,特征圖之間有共享的神經(jīng)權(quán)重,且每一個(gè)權(quán)重都與上一個(gè)神經(jīng)元連接,其具體公式如下:

其中l(wèi)表示層數(shù),j表示第j個(gè)特征圖,k表示卷積核,f表示激活函數(shù),b為偏置。
1.2.2 池化層
池化層利用了圖像的局部相關(guān)性原理,對(duì)卷積層輸入的特征在一個(gè)小的區(qū)域內(nèi)進(jìn)行統(tǒng)計(jì),在降低了維度的時(shí)候,保留了相關(guān)的信息。常用的池化層包括最大池化層、最小池化層、平均池化層。在池化操作后,輸入特征圖的寬度和高度縮小為原來(lái)的1/n。其中池化層的表達(dá)式如下:

其中,β表示乘性偏置,down表示池化函數(shù)。
支持向量機(jī)是一種監(jiān)督式的理論研究方法,它建立在統(tǒng)計(jì)學(xué)習(xí)的基礎(chǔ)之上,一般用來(lái)解決回歸問(wèn)題,異常點(diǎn)和分類(lèi)問(wèn)題。他的一個(gè)重要性質(zhì)是模型在優(yōu)化的過(guò)程中也對(duì)應(yīng)了數(shù)學(xué)問(wèn)題中的凸最優(yōu)化問(wèn)題,故其大多數(shù)的解都是全局最優(yōu)解。
如果假設(shè)訓(xùn)練的數(shù)據(jù)集在特征空間中是線性可分的,在支持向量機(jī)中,引入了邊緣的概念,被定義為決策邊界與任意樣本之間的最小距離。其中,決策邊界被選為使邊緣最大化的那個(gè)決策邊界。這種算法選擇了一個(gè)特征集合,并訓(xùn)練目標(biāo)函數(shù),使得目標(biāo)函數(shù)對(duì)于劃分的集合可以表示為對(duì)整個(gè)數(shù)據(jù)集的劃分結(jié)果。不僅提高了訓(xùn)練集的劃分能力,還降低了內(nèi)存的消耗。
支持向量機(jī)的優(yōu)點(diǎn)在于整個(gè)算法的訓(xùn)練過(guò)程訓(xùn)練時(shí)間短,且推廣能力強(qiáng),模型的建立較為簡(jiǎn)單且實(shí)驗(yàn)結(jié)果與實(shí)際結(jié)果較為接近[8]。
假設(shè)線性可分類(lèi)樣本的集合為(xi,yi),n維空間中線性判別函數(shù)通常選擇如下函數(shù):g(x)=wx+b,而分類(lèi)面方程如下:

若要對(duì)樣本正確的分類(lèi),則要求滿足條件:

其中sgn是符號(hào)函數(shù),b為閾值,對(duì)于樣本來(lái)說(shuō)通過(guò)計(jì)算f(x)來(lái)對(duì)樣本分類(lèi)。
樸素貝葉斯分類(lèi)器是一個(gè)傳統(tǒng)的分類(lèi)器。它的主要思想即以先驗(yàn)概率為依據(jù)去判斷樣本的類(lèi)別,并通過(guò)這個(gè)依據(jù)選取概率最大的類(lèi)別作為樣本的所屬類(lèi)別。貝葉斯分類(lèi)器的訓(xùn)練過(guò)程分為兩個(gè)階段,樣本訓(xùn)練階段和分類(lèi)階段。分類(lèi)器訓(xùn)練階段的目的是生成分類(lèi)器,并對(duì)一個(gè)樣本進(jìn)行分類(lèi)。
樸素貝葉斯分類(lèi)器由于其計(jì)算高效,且具有堅(jiān)實(shí)的理論基礎(chǔ),但是其具有條件獨(dú)立性這一個(gè)前提,在滿足這個(gè)條件下,可以達(dá)到誤分類(lèi)率最小[9]。
樸素貝葉斯分類(lèi)的模型如下:給定一組訓(xùn)練集{(x1,y1),(x2,y2)…(xm,ym) },其中m是樣本的個(gè)數(shù),每個(gè)數(shù)據(jù)集中包含n個(gè)特征,即xi=(xi1,xi2…xin)。設(shè)p(y=yi|X=x)表示輸入的樣本為x時(shí)輸出的y為yi的概率。故分類(lèi)器的依據(jù)就是找出最大的p(y=yi|X=x),就將x分為yi類(lèi)。依據(jù)貝葉斯定理,有:

而由于上式的分母都是一樣的,故樸素貝葉斯分類(lèi)器判別公式可以寫(xiě)成如下形式。

算法主要包括兩個(gè)框架,分別是使用SVM分類(lèi)器和樸素貝葉斯分類(lèi)器。主要思想是使用通過(guò)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)模型提取人臉的特征,之后利用支持向量機(jī)以及貝葉斯分類(lèi)器進(jìn)行分類(lèi)。算法框架如圖1。

圖1 算法的框架圖
算法主要包括三個(gè)步驟,圖像的預(yù)處理,卷積神經(jīng)網(wǎng)絡(luò)提取特征和特征分類(lèi)階段。在網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程中,利用訓(xùn)練的樣本圖像對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,之后通過(guò)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)提取輸入圖像的特征,將這些特征放入兩個(gè)分類(lèi)器進(jìn)行訓(xùn)練。在實(shí)驗(yàn)的驗(yàn)證過(guò)程中,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)提取特征后,放入分類(lèi)器識(shí)別圖片并于正確結(jié)果進(jìn)行比較來(lái)對(duì)比分類(lèi)器的性能。
在對(duì)人臉圖像進(jìn)行預(yù)處理的時(shí)候使用到了dlib中的人臉識(shí)別方法。dlib是一個(gè)現(xiàn)代的C++工具包,包含了用C++創(chuàng)建復(fù)雜軟件來(lái)解決實(shí)際問(wèn)題的機(jī)器學(xué)習(xí)算法和工具。它被廣泛應(yīng)用于工業(yè)界和學(xué)術(shù)界,包括機(jī)器人、嵌入式設(shè)備、手機(jī)以及大型高性能計(jì)算環(huán)境。
Dlib人臉檢測(cè)使用HOG特征與級(jí)聯(lián)回歸樹(shù)算法訓(xùn)練的模型,可以檢測(cè)圖片中人臉的數(shù)量以及位置。
在將圖片放入神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí)對(duì)人臉圖像進(jìn)行預(yù)處理,步驟如下:
(1)將圖像轉(zhuǎn)換為灰度圖。通過(guò)cv2中的cvtColor函數(shù)將測(cè)試集中的圖像轉(zhuǎn)換為灰度圖。
(2)人臉位置檢測(cè)。利用dlib中的函數(shù),識(shí)別圖片中的人臉位置。
(3)圖像縮放。獲得了圖片中的人臉位置后,通過(guò)resize函數(shù)放縮圖片至人臉周?chē)?4×64大小。
(4)圖像歸一化處理。將圖像轉(zhuǎn)換為灰度圖像后,其顏色的灰度值在0~255。將縮放后的圖像原始像素除以255進(jìn)行歸一化。
卷積網(wǎng)絡(luò)主要是由輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成的。每一層都有神經(jīng)元的個(gè)數(shù),卷積核的個(gè)數(shù)和相關(guān)參數(shù),池化函數(shù)等不同的特征,而訓(xùn)練神經(jīng)網(wǎng)絡(luò)的目的就是訓(xùn)練這些參數(shù)。由于目前卷積神經(jīng)網(wǎng)絡(luò)的理論知識(shí)尚不完整,故有一些參數(shù)的選取都是通過(guò)經(jīng)驗(yàn)來(lái)選擇的。本文設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下:
(1)輸入層由64×64的灰度圖像作為輸入。
(2)卷積層L1由32個(gè)3×3的大小的卷積核組成,填充后卷積得到了32個(gè)大小為64×64的圖像。
(3)池化層S1在2×2的范圍內(nèi)對(duì)L1輸出的圖像進(jìn)行最大值池化,得到了32個(gè)大小為32×32的圖像。
(4)卷積層L2由64個(gè)3×3的大小的卷積核組成,填充后卷積得到了64個(gè)大小為32×32的圖像。
(5)池化層S2在2×2的范圍內(nèi)對(duì)L2輸出的圖像進(jìn)行最大值池化,得到了64個(gè)大小為16×16的圖像。
(6)卷積層L3由64個(gè)3×3的大小的卷積核組成,填充后卷積得到了64個(gè)大小為16×16的圖像。
(7)池化層S3在2×2的范圍內(nèi)對(duì)L3輸出的圖像進(jìn)行最大值池化,得到了64個(gè)大小為8×8的圖像。最后通過(guò)全連接層,輸出一個(gè)512維的特征向量作為提取的特征。
具體的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。

表1 卷積網(wǎng)絡(luò)神經(jīng)結(jié)構(gòu)
實(shí)驗(yàn)使用的數(shù)據(jù)集是LFW人臉數(shù)據(jù)集。LFW(Labeled Faces in the Wild)人臉數(shù)據(jù)庫(kù)是由美國(guó)馬薩諸塞州立大學(xué)整理收集并得到的數(shù)據(jù)庫(kù),主要用來(lái)供人臉識(shí)別的訓(xùn)練使用。數(shù)據(jù)集中一共含有13000多張人臉圖像,每張圖片都標(biāo)有不同的ID,其中大約1680個(gè)人包含兩個(gè)或以上的樣本數(shù)據(jù)。
在使用這個(gè)數(shù)據(jù)集時(shí),選取了13,233張人臉圖片。對(duì)人臉圖像預(yù)處理后,放縮成為64×64的圖像作為待處理的圖像。其中圖像由多個(gè)不同的人臉身份采集。且表情和環(huán)境都存在一定的差異。本文將原始數(shù)據(jù)集分為十份,其中九份作為訓(xùn)練集訓(xùn)練模型,一份作為測(cè)試集作為正樣本測(cè)試結(jié)果,負(fù)樣本則選取與正樣本數(shù)量相同的非人臉數(shù)據(jù)集合。
在卷積神經(jīng)網(wǎng)絡(luò)中,卷積核的數(shù)量尺寸以及學(xué)習(xí)率的設(shè)置都會(huì)一定程度上影響神經(jīng)網(wǎng)絡(luò)的性能。
在卷積核的尺寸選擇方面,為了確保卷積后的特征圖為整數(shù),且經(jīng)過(guò)三層的卷積和池化后可以從64×64的圖像卷積到8×8的圖像,所以選擇的卷積核尺寸為3×3。每一層卷積前后的圖像尺寸變化可以由下式得到:

其中卷積前的圖像大小為n×n,卷積核的大小為m×m,卷積后的圖像大小為s×s。由于卷積時(shí)采用了填充的方法,故每次卷積過(guò)后的圖像尺寸不會(huì)發(fā)生變化。

圖2 訓(xùn)練集的人臉集合
卷積核個(gè)數(shù)的選取與卷積神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性相關(guān)。如果卷積核的數(shù)目越多,則提取的圖像特征越多,但是訓(xùn)練的時(shí)間也會(huì)相應(yīng)的變多。且每個(gè)數(shù)據(jù)集適合不同的卷積核個(gè)數(shù),如果卷積核個(gè)數(shù)過(guò)多,則網(wǎng)絡(luò)中的權(quán)重參數(shù)W的個(gè)數(shù)也變多,網(wǎng)絡(luò)變得更加復(fù)雜,而由于訓(xùn)練集的樣本個(gè)數(shù)不夠,選取的樣本和可提取的特征有限,故其無(wú)法滿足網(wǎng)絡(luò)的需求,所以學(xué)習(xí)的效果也會(huì)相應(yīng)的變差。所以在對(duì)不同的卷積核個(gè)數(shù)實(shí)驗(yàn)對(duì)比后,選擇了第一層的卷積核個(gè)數(shù)為32個(gè),后兩層的卷積核個(gè)數(shù)為64個(gè)。
學(xué)習(xí)率不僅影響了網(wǎng)絡(luò)中的訓(xùn)練收斂速度,同時(shí)也影響了網(wǎng)絡(luò)的訓(xùn)練時(shí)間和正確率。學(xué)習(xí)率過(guò)大會(huì)導(dǎo)致網(wǎng)絡(luò)不收斂,而學(xué)習(xí)率過(guò)小則會(huì)導(dǎo)致網(wǎng)絡(luò)的收斂時(shí)間過(guò)慢。在實(shí)驗(yàn)當(dāng)中選擇了一個(gè)經(jīng)驗(yàn)值0.01作為神經(jīng)網(wǎng)絡(luò)的Adam優(yōu)化算法的學(xué)習(xí)率。
在支持向量機(jī)中也有參數(shù)需要設(shè)置,主要包括錯(cuò)誤項(xiàng)的懲罰系數(shù)和采用的核函數(shù)是何種類(lèi)型。錯(cuò)誤項(xiàng)的懲罰系數(shù)越大,即對(duì)分錯(cuò)樣本的懲罰程度越大,因此在訓(xùn)練樣本中準(zhǔn)確率越高,但是泛化能力降低,也就是對(duì)測(cè)試數(shù)據(jù)的分類(lèi)準(zhǔn)確率降低。相反,減小錯(cuò)誤項(xiàng)的懲罰系數(shù)的話,容許訓(xùn)練樣本中有一些誤分類(lèi)錯(cuò)誤樣本,泛化能力強(qiáng)。由于實(shí)驗(yàn)的人臉識(shí)別中,對(duì)正確率的要求較高,所以選擇了一個(gè)較高的錯(cuò)誤想懲罰系數(shù)0.9。核函數(shù)的類(lèi)型選擇了高斯核函數(shù),因?yàn)闃颖臼菆D片,其具有線性不可分性,且卷積神經(jīng)網(wǎng)絡(luò)提取的特征沒(méi)有包含任何的先驗(yàn)知識(shí),故使用這個(gè)核函數(shù)。
3.3.1 訓(xùn)練過(guò)程
在使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過(guò)程中,使用Tensor-Board可視化工具查看訓(xùn)練過(guò)程。其中準(zhǔn)確率的變化過(guò)程如圖3所示。

圖3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率(accuracy)變化過(guò)程
可以看到,隨著訓(xùn)練次數(shù)的增加,卷積神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率越來(lái)越接近于1。在實(shí)驗(yàn)中設(shè)置的訓(xùn)練終止閾值為0.98,所以當(dāng)訓(xùn)練的結(jié)果準(zhǔn)確率大于或等于0.98時(shí)則停止訓(xùn)練。
定義的損失隨著訓(xùn)練過(guò)程的變化如圖4所示。

圖4 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練損失(loss)變化過(guò)程
在訓(xùn)練的過(guò)程中,損失越來(lái)越接近于0,最后收斂到了0.100附近。故整個(gè)網(wǎng)絡(luò)的訓(xùn)練過(guò)程是逐漸收斂的,且收斂的速度較快,在訓(xùn)練到700次左右時(shí),網(wǎng)絡(luò)訓(xùn)練完成。
3.3.2 結(jié)果對(duì)比
在進(jìn)行實(shí)驗(yàn)時(shí),實(shí)驗(yàn)的訓(xùn)練階段和測(cè)試階段是分開(kāi)的。故在模型訓(xùn)練完成后,將模型中的參數(shù)保存,在測(cè)試階段時(shí)再讀出參數(shù)來(lái)測(cè)試模型的性能。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)采用批處理的訓(xùn)練方式,每次處理128張圖片作為一批,在計(jì)算誤差時(shí)計(jì)算一批圖片的準(zhǔn)確率,當(dāng)準(zhǔn)確率達(dá)到98%時(shí)則表示卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)束。
在訓(xùn)練完卷積神經(jīng)網(wǎng)絡(luò)后,用訓(xùn)練好的網(wǎng)絡(luò)重新提取訓(xùn)練集中的圖片特征作為輸入訓(xùn)練支持向量機(jī)和貝葉斯分類(lèi)器,分類(lèi)器的輸出即為圖片的識(shí)別結(jié)果。
在測(cè)試時(shí),分別用五個(gè)不同的測(cè)試集測(cè)試了五次兩個(gè)分類(lèi)器的識(shí)別結(jié)果,實(shí)驗(yàn)結(jié)果如表2所示。

表2 支持向量機(jī)和貝葉斯分類(lèi)器結(jié)果對(duì)比
從結(jié)果可以看出,貝葉斯分類(lèi)器的效果每一次都比支持向量機(jī)要好。故采用卷積神經(jīng)網(wǎng)絡(luò)提取特征與貝葉斯分類(lèi)器結(jié)合的模型效果識(shí)別效果更好。
目前的人臉識(shí)別技術(shù)仍然是學(xué)術(shù)界和工程界的一個(gè)熱點(diǎn)研究問(wèn)題。本文基于卷積神經(jīng)網(wǎng)絡(luò)提取的特征,分別使用兩類(lèi)傳統(tǒng)分類(lèi)器:支持向量機(jī)和貝葉斯分類(lèi)器進(jìn)行人臉識(shí)別,并比較結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)后,哪一個(gè)分類(lèi)器的準(zhǔn)確率更高,效果更好。不足之處在于可以對(duì)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率進(jìn)行一定的實(shí)驗(yàn)對(duì)比來(lái)選擇更適合的數(shù)值,且卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)也可進(jìn)行多次對(duì)比選擇。