馮賀平(河北軟件技術學院 智能工程系,河北 保定 071000)
深度信念網在人臉檢測技術中的應用研究
馮賀平
(河北軟件技術學院智能工程系,河北保定071000)
摘要:在一個國家發展中,高度重視信息安全,一旦信息安全中出現漏洞,一些不法分子就會趁虛而入,人臉檢測技術的出現,能夠詳細的把握住每個人的信息,在處理一些工作中會帶來很大的幫助,因此,文章通過下文對深度信念網在人臉檢測技術中的應用進行了分析與闡述。
關鍵詞:深度信念;人臉檢測;應用研究
深度信念網為當前一種非常先進的技術方式,其具備非常強大的函數表現能力,將從少數樣本中學習數據本質豎向的優點能夠充分的展示出來,因此,將這種技術理念和技術措施應用到人臉檢測技術中意義將非常重大。
深度學習中包含著深度信念網絡這個常用的模型。有可見層存在于該模型中,并且還具備輸出層和隱層兩部分,其中由多層的受限波爾茲曼機構成了其中的隱層,沒有連接起來層內的神經,但是,能夠互相連接起層間的神經元,隱層的功能對可見層中的有關數據進行捕捉訓練。
并且,能夠將模型權重生成出來,通過大量的實踐證明這是一種非常有效的方式。在應用的時候,原始輸入的特征向量能夠通過可見層展示出來,利用現有的輸入特征向量,在經過神經元向著隱層中映射,這樣隱層的特征向量就能夠被有效的獲取出來,之后利用隱層在向著輸入層中映射,進而將傳統的特征向量就能夠重新構建起來,對于完成的特征向量再向著隱層中映射,如此一來,隱層單元的特征向量就能夠再次的被獲取出來,吉布斯采樣即為上述所闡述的過程,在更新權值的過程中,輸入單元和隱層單元之間的差別即為其中的重要依據。
H inton等人將深度學習概念提了出來,將多層神經網絡具備的優秀特征學習能力充分的展現了出來,存在于其中的特征能夠更加深刻有效的刻畫出其中的數據,進而在可視化和分類的過程中都發揮著巨大的作用。通過將大量的訓練數據和多隱層的神經網絡構建起來出來,來對更加本質的特征進行學習,進而將分類的準確性有效的提升上來。有多個受限波爾茲曼基層一同構成了DBN,從上一層的隱單元中就能夠獲取到每一層中的關聯數據,圖1即為一個比較突出的DBN結構圖形。

圖1
(1)人臉識別算法的分析。基于瞳孔區域及視覺系統同大腦皮層神經元的相關性探究,在人臉識別的過程中,多通道特征在其中發揮著非常重要的作用,在這種思想的基礎上,結合起DBN模型和降維模型,進而在DBN多通道人臉識別方法的基礎上,還能夠獲取出兩種不同降維結構。
結合起來DBN和降維模型,將Gabor濾波器組卷和局部人臉圖像塊有效的結合起來,在擬合數據的過程中在應用相應的RBM模塊,進而將圖像塊中的相似信息就能夠進一步降低下來,進而將更加本質的特征就能夠提取出來,在訓練DBN網絡的過程中,在積極的應用降維后的特征向量。
在建立人臉識別模型的過程中,還是將DBN模型同降維模型有效的結合起來,將Cabor小波核函數卷積和劃分圖像塊的人臉圖像有效的結合起來,進而能夠將頻率不同方向不同的特征向量準確的獲取出來,這樣將其作為DBN的可視層單元對網絡完成訓練化處理。
這樣在完成了所生成的模型之后,將一個邏輯回歸層加設到頂層中,然后向著類別信息上映射圖像特征。這種計算方式解決了圖像利用Gabor小波獲得信息后,圖片特性過高維數的不足之處,并且,對RBM對本質特征的提取和對數據的擬合可以更好的進行應用。
(2)算法的具體學習和訓練過程分析。在訓練深度信念網絡的過程中,利用所獲取到的降維特征向量,如上圖所示,將RBM隱層的輸入利用底層圖像的特征來進行訓練,輸入數據在訓練下一個RBM時主要是應用每個底層的RBM,對CD算法進行使用,進而將權值生成出來,當將一組堆疊的RBM逐層的學習完成之后,在微調整個網絡的過程中,會應用到頂層的帶標簽數據。其中詳細的過程主要有這樣幾部:1)預先訓練。對基于CD-K的快速學習算法所構建起來的RBM模型進行參照,進而將各個RBM逐層的訓練出來,進而將隱層節點和可視層節點間的權值能夠有效的獲取出來;2)微觀的訓練。在完成了預訓練之后,為了確保有更好的表現能力存在于模型中,這樣用誤差反向傳播算法來進行一步的優化和調整DBN模型。將一層邏輯的回歸層加設到模型的頂層上面,這樣在對應的類別信息上能夠將所有的圖像特征反射上去,因此,就能夠利用一個辨別的模型將DBN模型映射出來,針對這樣一個回歸過程而言,在全局化微調優化整個模型的連接權值過程中可以應用經典的BP算法。詳細過程為:在監督訓練模型的過程中,可以應用數據的標簽值,進而對各個層次間的連接權值進行微觀的調整,從而可以將小模型的具體標簽值和目標預測值的誤差有效的降低下來。在應用BP算法微調模型的時候,這樣就會向著一個誤差非常小的狀態中將模型收斂進去,這是由于預先貪婪的訓練了DBN的模型,對于以前的BR算法,參數收斂在訓練模型中表現的非常緩慢。隨著位置的改變,人臉的Gabor的特征相位也會發生一定的改變,這樣在匹配識別階段的信息中就會非常的困難,而圖像的局部能量譜就能夠通過幅值信息展現出來。并且有良好的光滑性會存在于邊緣附近,在位置發生變化后它也不會改變。這樣在匹配識別中就會發揮巨大的作用。因此,在進行信息識別時,就可以應用特征幅值的方式。
綜上所述,深度學習,可通過學習一種深層非線性網絡結構,實現復雜函數逼近,該算法克服了因姿態變換等因素引入的非線性干擾,具備一定的抗干擾能力,并且能夠保證一定的實時性,從而克服了視頻檢測中遇到的難題,使該系統識別率更高,且自主識別,自主學習、自主更替模型的功能。
參考文獻:
[1]柴瑞敏,曹振基.基于Gabor小波與深度信念網絡的人臉識別方法[J].計算機應用,2011(08).
[2]吳小俊.圖象特征抽取與識別理論及其在人臉識別中的應用[D].南京:南京理工大學,2002.
[3]周昕.基于 BP 神經網絡的人臉識別技術的研究[D].南京:南京理工大學,2007.
[4]陳伏兵,楊靜宇等.基于模塊2DPCA的人臉識別方法[J].中國圖象圖形學報,2006(04).
課題名稱:深度信念網在人臉檢測技術中的應用研究保定科技局廳級自然科學指導性課題,課題編號14ZG 041。
作者簡介:馮賀平,研究方向:智能檢測、智能控制