999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TPLBP/HOG特征與DBN深度模型的人臉識別研究

2019-09-19 07:33:10
測控技術 2019年6期
關鍵詞:人臉識別特征提取特征

(華東交通大學 電氣與自動化工程學院,江西 南昌 330013)

目前,人臉識別已經成為機器視覺、模式識別和人工智能領域的熱門話題,具有廣泛的應用領域,但它也是一項具有挑戰性的任務[1],因為不同人的五官差異巨大,并且有著豐富的表情。一般來說,人臉識別系統具有兩個關鍵部分[2]:人臉面部特征提取和識別匹配。

面部特征提取是人臉識別任務的關鍵問題。為了表征人臉信息,提取的特征是否合適對后一步分類性能產生重要影響。文獻[3]提出對人臉圖像進行多方向多尺度DCP(Dual-Cross Patterns)特征提取,利用高斯算子的一階導數來減少光照差異的影響,然后在全局和分區級別計算DCP特征,再對高維DCP特征降維,實驗結果表明該方法能達到較高識別率,但是使用該方法提取得到的人臉特征維數過高,計算量較大,復雜度較高,導致識別速度較久。文獻[4]提出對人臉圖像使用Gabor相位圖的直方圖來進行特征提取,與其他特征提取技術相比,使用Gabor算子可以更快地完成特征檢測,然而,單一特征對人臉圖像的表述有限,不能完整地表達人臉圖像的信息。文獻[5]提出了一種將人臉圖像的局部二值模式(Local Binary Pattern,LBP)紋理特征和方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征相融合的特征表達方法,實驗結果表明,相較于使用單一特征,融合特征能更完整地表達人臉信息,達到更好的效果。

在分類識別算法方面,目前廣泛研究的有支持向量機(Support Vector Machine,SVM)[6]、決策樹、K最近鄰(K-Nearest Neighbor,KNN)[7]等。文獻[8]采用了一種基于TBE-CNN(Trunk-Branch Ensemble Convolutional Neural Networks)模型用于人臉識別方法,該方法從整體臉部圖像和圍繞臉部分區圖像中提取信息,通過在干線和分支網絡之間共享低層和中層卷積層來高效地提取人臉信息特征,最后實驗驗證了所提出方法的有效性。然而,直接以像素級的人臉圖像作為輸入,CNN模型會因為光照、傾斜、背景變化學習到不良的特征,最終影響識別的結果。Hinton[9]提出深信念網絡(Deep Belief Nets,DBN)模型,DBN是一種模擬哺乳動物大腦皮層的感知過程,通過逐層訓練,將感知的高維度低層次的信息分類識別的深度學習算法。DBN作為一種深度學習算法,適合人臉的識別。

為了獲得更高的人臉識別準確率,針對以上人臉識別算法的問題,筆者提出了多紋理特征融合,主成分分析法(Principal Component Analysis,PCA)[10]將特征數據進行降維處理,結合DBN強大的函數表達能力對人臉數據進行訓練并識別。通過對DBN深度模型的參數的動態搜索確定最佳值后,提出了基于DBN模型的人臉識別算法。經測試,該算法比傳統的SVM、KNN和DBN更加準確。

1 深度信念網絡模型(DBN)

DBN是一個典型的多層次深度學習結構,是由多層限制玻爾茲曼機(RBM)疊加組成的概率生成神經網絡。典型的DBN結構如圖1所示。

1.1 受限玻爾茲曼機(RBM)

RBM是一種典型的神經網絡,由2層神經元組成,分別稱為可見層和隱藏層,可見層與隱藏層的神經元之間為雙向連接,同一層RBM的單元不相互連接。本質上,RBM是一個二部圖,它的隱藏層能夠獲得可見層神經元的輸入數據的高階相關性。RBM的可見層用v表示,用于接收輸入信號,隱藏層由h表示,可視為是輸入信號的特征提取器。RBM模型如圖2所示。

圖1 DBN深度信念模型

圖2 受限玻爾茲曼機(RBM)

1.2 DBN訓練方法

DBN的關鍵特征是它的相鄰層可以分成幾個獨立的RBM。DBN的原理是采用最底層DBN的輸出作為下一層的輸入,然后將下一層的輸出作為更高層的輸入。在實踐中,DBN的訓練過程包括兩個步驟:預訓練和微調。

(1) DBN預訓練。

預訓練本質上是一種自下而上的無監督學習過程。由于RBM無法完美模擬原始數據的特征,因此需要更高層次的網絡來模擬特征,無監督訓練的貪婪學習方法是有效的。這種方法也被稱為對比散度法(Contrastive Divergence,CD)。該CD學習方法有效地提高了基于混合模型的似然概率的訓練數據下界。作為能量模型,RBM通過使用以下能量函數來表征可見和隱藏層之間的關系。

RBM的能量函數為

(1)

θ={w,b,c}

式中,wij為可見層神經元vi和隱藏層神經元hj之間的關聯強度;偏置系數bi和cj分別為可見層神經元vi和隱藏層神經元hj自身的權重。

該模型可見層和隱藏層的聯合概率分布為

(2)

vi和hj只能是“0”或“1”的二值函數,“1”表示該神經元被激活,“0”為沒有激活。在一個RBM中,隱藏層神經元被可見層激活的概率為

(3)

由于可見層和隱藏層是雙向連接的,可見層神經元被隱藏層激活的概率為

(4)

為了在一階方法中優化v的對數似然性,需要logP(v)關于θ的梯度為

(5)

(6)

(7)

根據以上3個梯度公式,經過若干次對比散度迭代訓練,就可以求出網絡參數。

(2) DBN微調。

預訓練之后,RBM模型的每一層都已初始化。所有的RBM模型按照訓練順序粘接在一起形成一個DBN。調整訓練過程基于輸入數據和重構數據之間的損失函數。采用反向傳播算法重新調整網絡參數,最終得到全局最優網絡。輸入數據與重構數據之間的使用損失函數為

(8)

式中,x為輸入數據,x′為重建數據;‖·‖2表示重建誤差的L2范數形式。

DBN模型的預訓練過程的本質就是求取每一層RBM的參數,將與訓練獲取到的參數作為BP網絡的初始化參數,利用BP網絡對預訓練參數進行整體微調,從而克服訓練時間過長以及陷入局部最優解的缺點。

2 多特征提取融合

本文提出了一種基于全局人臉圖像HOG特征和分區人臉圖像TPLBP特征融合的人臉識別新框架,它結合了HOG特征和TPLBP特征的優點,優勢互補,統一融合特征可以濾除噪音,更好地表達人臉紋理信息。

2.1 TPLBP特征

LBP特征是描述圖像的紋理信息最好的特征之一,具有旋轉不變性和對單調灰度變化的不變性,區分性高,且其分類能力強、計算效率高,使其適用于要求苛刻圖像分析人物,已經被Ahonen[11]等人應用于人臉識別并取得了很好的效果。為了使LBP算子能夠適應不同尺度的紋理特征,Wolf[12]等人提出了一種改進的LBP算子——Three-Patch LBP Codes(TPLBP),TPLBP將3×3鄰域拓展到了任意鄰域,不再是中心像素灰度值與其方形鄰域像素之間灰度值比較,而是通過比較3個鄰域局部塊像素的灰度值來產生代碼,分配給每個像素單個的比特值。其中,中心塊、鄰域局部塊的維度以及中心塊和周圍局部塊之間的距離都是任意的。

用α和w分別表示中心塊和局部塊的維度,S個局部塊均勻分布在以中心塊為原心、半徑為r的環中,沿著該環取一對局部塊,并將它們的灰度值與中心塊的灰度值進行比較。根據兩個局部中的灰度值哪一個更加類似于中央塊的像素值來設置單個比特的值。通過對每個像素應用式(9)來生成TPLBP:

(9)

式中,Ci和C(i+α)mods分別為沿著環的兩個局部塊;Cp為中心塊。 函數d是兩個塊之間的任意距離函數,τ是略大于零的閾值。具體的TPLBP算子運算過程如圖3所示,計算式中,α=2,S=8,w=3。

可見,TPLBP特征算子作為紋理描述算子,不僅保留了LBP算子旋轉不變性和灰度不變性的優點,相比LBP其維數大大降低,具有更高的計算效率。由于TPLBP是以中心對稱方式進行特征提取的,所以TPLBP比LBP具有更強的抗噪能力。

為了更好地描述圖像局部的紋理差異,在保留全局紋理特性的基礎上能增加微觀紋理信息,將整幅圖像劃分成若干成若干子塊圖像,分別提取各個子塊內的TPLBP特征直方圖,然后按照先行后列的順序組合成整幅圖像的TPLBP直方圖。圖4為分區TPLBP 直方圖的構建過程圖。

2.2 HOG特征

HOG作為SIFT特征的關鍵點描述,在對象檢測和模式匹配方面取得了巨大的成功。HOG提取的紋理特征不僅可以詳盡地表述圖像內容,還能弱化光線干擾,同時,可以忽略細微的面部表情動作而不影響檢測效果。

圖4 分區TPLBP直方圖的構建過程

HOG特征提取過程如圖5所示,具體步驟如下[13]。

圖5 HOG 特征提取過程

① 對采集到的圖像先做Gamma標準化處理,消除光照變化的影響。

② 將處理后的圖像分割為若干個小塊(block),每塊由4個細胞單元(cell)組成。計算圖像中像素點(x,y)處的水平方向梯度和垂直方向梯度為

Gx(x,y)=H(x+1,y)-H(x-1,y)

(10)

Gy(x,y)=H(x,y+1)-H(x,y-1)

(11)

像素點(x,y)處的梯度幅值和梯度方向分別為

(12)

(13)

③ 每個細胞單元對梯度直方圖進行規定權重的投影,統計每個細胞單元的梯度直方圖,進而得到每個小塊的直方圖。

④ 對每個細胞單元進行對比度歸一化。

⑤ 將所有歸一化后的特征向量串行級聯,以構成整張圖像的HOG特征。

圖6為部分人臉圖像提取出來的HOG特征。

圖6 HOG 特征提取過程

2.3 特征融合

為了得到人臉圖像更加完整、有效的描述,將得到的TPLBP特征和HOG特征級聯融合,特征融合過程如圖7所示。

圖7 多特征融合的流程

3 TPLBP/HOG融合特征和DBN結合的人臉識別算法

本文提出了一種TPLBP/HOG融合特征和深度信念網絡(DBN)相結合的人臉識別的方法,算法流程圖如圖8所示。

該算法具體步驟如下:

① 對訓練樣本和測試樣本的人臉圖像灰度化,然后進行限制對比度自適應直方圖均衡(Contrast Limited Adaptive Histogram Equalization,CLAHE)[14]預處理。

② 利用第1節中的特征提取融合方法分別提取TPLBP紋理特征和HOG特征,每張人臉提取出來的HOG特征轉至為一維數據,而每張人臉的TPLBP紋理特征提取出來后轉至為行向量的數據矩陣,將這些特征數據合并起來并作為一行向量d=(x1,x2,…xn),將TPLBP紋理特征與HOG特征進行串聯融合就會形成訓練數據。為了加快訓練速度,利用PCA法對訓練的特征數據矩陣進行降維處理,經過PCA降維后的訓練特征訓練數據記為train_x;同理,對于測試數據也利用相同的方法進行數據提取與降維,記為test_x。

③ 利用步驟②中獲取到的train_x作為訓練數據輸入到DBN中進行訓練。

④ 對第一層RBM模型利用對比散度算法進行訓練,從而獲取到最優參數。

⑤ 在多層RBM網絡中,采用前一層RBM網絡隱藏層的輸出作為后一層RBM網絡的可見層的輸入,通過對比散度算法訓練神經網絡,以獲得最低能量函數以及RBM的最優參數。

⑥ 重復步驟④與步驟⑤,依次迭代循環訓練各個RBM層,直至訓練完所有RBM網絡;

⑦ 訓練完所有RBM網絡得到各個RBM層最優參數后,最終利用RBM的參數作為BP神經網絡的輸入,不斷修正調整RBM參數直至得到最優DBN模型。

4 實驗結果及分析

為了驗證本文算法的有效性,選用ORL人臉數據庫進行識別實驗,為進一步驗證本文算法的性能,在Yale和Yale-B人臉庫上進行性能測試。

ORL人臉數據庫共有40個人,每個人有10張圖像數據,選取每個人的7張圖片作為訓練數據,其他3張作為測試數據,則訓練樣本總共有280張圖像,測試總共有120張圖片。AR人臉數據庫中包含了120個人的4000張彩色圖片,選取每個人的7張圖片作為訓練數據,3張作為測試數據。Yale-B人臉數據庫包含38個人,每個人有64幅不同光照的圖像。從每人的圖像中選出正面標記的10張圖像,7張作為訓練數據,其他3張作為測試數據。

4.1 DBN參數設置

以ORL人臉數據庫為基礎對人臉識別系統中的重要參數進行了實驗,以確定每個參數的最優取值[15]。

所設置的DBN網絡深度為3層,其中包含2層RBM神經網絡和1層BP神經網絡。設置每層RBM的學習率為0.8,迭代次數為30;選擇Sigmoid函數作為BP網絡的傳遞函數,NN的迭代次數為100。根據經驗數值,設置RBM神經網絡的MiNi_Batchs為100,NN網絡的MiNi_Batchs為20,使得整個網絡的學習速率更加快速一些。

通過不斷調整RBM隱藏層神經元的個數來尋找網絡最優參數,經過多次實驗,本文選取lambda為0.025;隱藏層神經元個數為120;迭代次數為100。

4.2 與其他方法對比

4.2.1 基于DBN模型不同特征提取方法識別率對比

為了驗證本文中TPLBP/HOG融合特征對于人臉信息表征的有效性,在人臉圖像中分別提取LBP、TPLBP、HOG、TPLBP/HOG 融合特征,然后再根據提取得到的不同特征使用DBN深度模型在3種人臉數據庫上進行人臉識別實驗。不同特征的識別準確率對比如表1所示。

表1 基于DBN模型的不同特征識別準確率對比

由表1可知,基于TPLBP/HOG融合特征的人臉識別率高于單一特征表達方法的識別率,反映了基于全局人臉圖像HOG特征和分區人臉圖像TPLBP特征具有很好的互補作用,本文提出的TPLBP/HOG融合特征能更全面地表達人臉圖像信息。

4.2.2 基于TPLBP/HOG融合特征不同分類算法識別率對比

為了驗證DBN模型對于人臉識別的有效性,將DBN與經典模式算法SVM和KNN算法進行對比。在人臉圖像中提取TPLBP/HOG融合特征,之后采取不同的分類算法都以TPLBP/HOG融合特征作為輸入,分別在3種人臉數據庫上進行驗證。對比試驗結果如表2所示。

表2 基于TPLBP/HOG融合特征不同分類算法識別準確率對比

由表2可知,都以TPLBP/HOG融合特征輸入SVM、KNN和DBN分類算法時,DBN模型對于人臉識別在不同的人臉數據庫中識別準確率均高于傳統的學習算法SVM和KNN。DBN模型將無監督的訓練學習和有監督的微調結合,能夠自主從高維度低層次的圖像特征中學習到高層次的特征信息,在人臉識別中取得了良好的效果。

4.2.3 不同實驗方法識別率對比

為了驗證TPLBP/HOG融合特征和DBN結合的人臉識別算法相較于傳統的監督分類算法SVM、KNN以及傳統DBN深度學習算法在人臉識別準確率上的優越性,特地利用3種人臉數據庫形成相同的訓練和測試數據對這3種算法進行了測試驗證,測試結果如表3所示。

表3 不同實驗方法測試對比結果

由表3可知,本文提出的基于TPLBP/HOG融合特征和DBN深度模型相結合的人臉識別算法在3種不同的人臉數據庫實驗中,識別準確率是最高的。尤其在ORL人臉數據庫中,識別效果最好,達到了98.33%,比傳統的基于LBP的SVM和KNN方法分別提高了13.03%和5.13%,比傳統DBN深度學習方法也提高了3.51%。這說明,DBN模型在對人臉特征信息學習和分類方面更好。

5 結束語

本文采用TPLBP/HOG融合特征和DBN深度模型相結合的人臉識別方法。提取全局人臉圖像HOG特征和分區人臉圖像TPLBP特征并融合,融合后的特征同時包含人臉圖像的紋理和結構特征,能更豐富地表達人臉的信息。DBN作為深度學習算法之一,能自主將感知的人臉圖像信息的低層次信息轉變為高層次信息,進一步提高了識別的準確率。將本文方法在ORL、AR、Yale-B人臉數據庫上進行實驗測試,識別率分別達到98.33%、97.39%和96.72%,體現了基于TPLBP/HOG融合特征和DBN深度模型方法在提取人臉特征、人臉識別上有很好的效果,魯棒性強。在今后的研究中,視頻數據處理將成為研究工作的重點,未來的目標是從實時視頻中實現人臉識別。

猜你喜歡
人臉識別特征提取特征
人臉識別 等
作文中學版(2022年1期)2022-04-14 08:00:34
揭開人臉識別的神秘面紗
學生天地(2020年31期)2020-06-01 02:32:06
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于類獨立核稀疏表示的魯棒人臉識別
計算機工程(2015年8期)2015-07-03 12:19:07
基于MED和循環域解調的多故障特征提取
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 国产精品欧美亚洲韩国日本不卡| 人人91人人澡人人妻人人爽| 尤物视频一区| 一本色道久久88| 亚洲成a人片在线观看88| 亚洲精品欧美日本中文字幕| 亚洲欧洲日韩综合色天使| 中文字幕亚洲综久久2021| 成人午夜久久| 国产成人精品男人的天堂下载| 成人亚洲天堂| 亚洲永久免费网站| 国产毛片高清一级国语| 日韩欧美国产中文| a级毛片网| 日韩精品久久无码中文字幕色欲| 亚洲欧洲日产无码AV| 国产日韩精品一区在线不卡| 亚洲成a人片| 免费99精品国产自在现线| 国产网友愉拍精品视频| 在线看国产精品| 亚洲人网站| 国产97色在线| 无码精油按摩潮喷在线播放| 麻豆精品在线视频| 免费在线看黄网址| 欧美日韩成人在线观看| 国产成人无码AV在线播放动漫| 亚洲男人的天堂在线| 久久99这里精品8国产| 久久国产亚洲偷自| 国产午夜一级毛片| 欧美色亚洲| 另类欧美日韩| 992tv国产人成在线观看| 国产成人精品高清在线| 热99精品视频| 91在线中文| 国产精品永久在线| 精品一区二区久久久久网站| av在线手机播放| 伊人久久久久久久久久| 国产AV无码专区亚洲A∨毛片| 久久综合丝袜长腿丝袜| 广东一级毛片| 97在线视频免费观看| 成人噜噜噜视频在线观看| 欧美有码在线| 成年人午夜免费视频| 97综合久久| 欧美色伊人| 亚洲国模精品一区| 久久综合五月| 亚洲精品成人7777在线观看| 孕妇高潮太爽了在线观看免费| 日韩免费无码人妻系列| 色综合久久久久8天国| 亚洲啪啪网| 中文字幕天无码久久精品视频免费 | 色老头综合网| 国产二级毛片| 一级全免费视频播放| 99人体免费视频| 中文字幕免费在线视频| 无码一区18禁| 国产69精品久久久久妇女| 色网站在线视频| 久久久无码人妻精品无码| 国产精品第页| 久久综合色播五月男人的天堂| 国产女同自拍视频| 天天色天天综合网| 毛片视频网址| 无码啪啪精品天堂浪潮av| 大学生久久香蕉国产线观看| 激情视频综合网| 国产乱子伦精品视频| 狠狠色综合久久狠狠色综合| 国产精品成人AⅤ在线一二三四| 中文字幕无码电影| 国产女人在线视频|