彭業(yè)勝 龔利英
摘要:本文針對(duì)人臉表情識(shí)別技術(shù)進(jìn)行了深入的探討,其主要采用了深度卷積神經(jīng)網(wǎng)絡(luò)中具有映射作用的方法,通過此方法對(duì)使用者進(jìn)行了面部關(guān)鍵點(diǎn)定位計(jì)算,最終提出了魯棒表情關(guān)鍵點(diǎn)定位算法。
關(guān)鍵詞:深度學(xué)習(xí);魯棒表情;關(guān)鍵點(diǎn);定位算法
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)06-0142-01
近年來,深度學(xué)習(xí)的魯棒表情得到了突破性進(jìn)展,促進(jìn)了其相關(guān)研究領(lǐng)域的突破和創(chuàng)新。目前,最具有技術(shù)性的信息傳遞方式就是面部表情,能夠及時(shí)反映出人們最真實(shí)的內(nèi)心情感,起到相互溝通交流的作用。隨著現(xiàn)代信息技術(shù)的飛速發(fā)展,人臉識(shí)別的方式越來越廣泛,無論在通信、心理、醫(yī)療、人機(jī)交互還是國(guó)防安全中都開始流行人臉表情識(shí)別。可見,采用人臉表情識(shí)別的方式能夠促進(jìn)科學(xué)發(fā)展,具備可觀的市場(chǎng)價(jià)值。
1 微表情魯棒關(guān)鍵點(diǎn)識(shí)別定位的意義
人類具有面部表情、語言、肢體動(dòng)作等表達(dá)表達(dá)思想情感的方式。美國(guó)有相關(guān)專家通過研究發(fā)現(xiàn),人與人交流中,信息主要通過語言傳遞僅僅占有7%,而絕大部分信息傳遞都是依靠面部表情,其主要占有55%。普通表情和微表情是面部表情的主要類型,其中,微表情囊括了用戶人們所有的面部表情,微表情能夠直接真實(shí)的反映出人們的內(nèi)心情緒以及情感。因此,對(duì)微表情進(jìn)行分析識(shí)別是一項(xiàng)具有交叉性的研究項(xiàng)目,因?yàn)槠渖婕暗胶芏囝I(lǐng)域,主要包括信息處理、臨床心理學(xué)、信號(hào)強(qiáng)度、計(jì)算機(jī)等,是一項(xiàng)值得研究和開發(fā)的項(xiàng)目,能夠推動(dòng)各個(gè)領(lǐng)域共同發(fā)展,促進(jìn)各領(lǐng)域間的聯(lián)系和交流。
即使測(cè)謊儀已經(jīng)廣泛應(yīng)用于國(guó)際反恐、國(guó)家安全、司法偵訊中,雖然能夠通過腦成像技術(shù)以及ERP技術(shù)進(jìn)行測(cè)謊,但是在現(xiàn)實(shí)生活中缺乏應(yīng)用。而且,在使用過程中,人體難免會(huì)直接到這些儀器設(shè)備,若接觸到人體就會(huì)喚醒用戶的情緒,進(jìn)而對(duì)測(cè)試結(jié)果進(jìn)行干擾。通過對(duì)此,采用相關(guān)的設(shè)備對(duì)用戶的微表情進(jìn)行檢測(cè),就可以在用戶不知情的情況下實(shí)行心理測(cè)試。在司法領(lǐng)域,法官能夠借助犯罪嫌疑人的微表情,來檢測(cè)犯人說話的真實(shí)性;在臨床領(lǐng)域中,心理學(xué)家和醫(yī)生能夠通過患者的微表情了解患者對(duì)特定行為的真實(shí)態(tài)度,從而對(duì)癥治療;在安全領(lǐng)域中,工作人員通過觀察微表情的方式,來判斷出對(duì)方有無攻擊性意圖。因此,本文在信號(hào)、計(jì)算機(jī)、臨床心理學(xué)和信息處理等多個(gè)領(lǐng)域具有不言而喻的應(yīng)用價(jià)值。
2 深度學(xué)習(xí)的算法原理
機(jī)器學(xué)習(xí)歸屬于人工智能,其原理是通過算法使得機(jī)器從大量的數(shù)據(jù)中尋求和使用規(guī)律,從而通過智能的形式識(shí)別更多的樣本,還可以對(duì)未來進(jìn)行預(yù)測(cè)。在人工神經(jīng)網(wǎng)絡(luò)中,有一種全新的學(xué)習(xí)方式叫做深度學(xué)習(xí),主要對(duì)腦神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬,從而實(shí)現(xiàn)分析學(xué)習(xí),不僅如此,還可以借助分布式并行算法對(duì)人腦信息進(jìn)行分析。深度學(xué)習(xí)是集特征以及分類器于一體,在算法中,又主要集構(gòu)建多隱層以及非線性變換模型于一體,從基礎(chǔ)數(shù)據(jù)中抽象出高層特征。本文介紹了兩種典型的深度學(xué)習(xí)網(wǎng)絡(luò),并重點(diǎn)介紹了卷積神經(jīng)網(wǎng)絡(luò)的算法原理和機(jī)制。
3 典型深度學(xué)習(xí)網(wǎng)絡(luò)
深度學(xué)習(xí)是將大量的數(shù)據(jù)以學(xué)習(xí)模型的方式進(jìn)行規(guī)律尋找,能夠?qū)τ杏锰卣鞯倪M(jìn)行把握學(xué)習(xí),能確保分類和預(yù)測(cè)的精準(zhǔn)性。深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)繁多,并且每個(gè)結(jié)構(gòu)都有不同的應(yīng)用領(lǐng)域和條件,無法在數(shù)據(jù)集中進(jìn)行統(tǒng)一,所以就不能對(duì)它們的性能做出統(tǒng)一的比較。本文主要介紹了深度置信網(wǎng)絡(luò)和深度玻爾茲曼機(jī)。
(1)深度置信網(wǎng)絡(luò)。其主要是由概率而生成的模型,主要的概率分布和邏輯關(guān)系是依靠具體數(shù)據(jù)與標(biāo)簽進(jìn)行確定的。多層限制性玻爾茲曼形成了DBN,主要采用無監(jiān)督、分層訓(xùn)練的學(xué)習(xí)方法。與玻爾茲曼機(jī)相比,深度信念網(wǎng)絡(luò)進(jìn)一步完善了對(duì)權(quán)重的計(jì)算方法。在深度置信網(wǎng)路中不適宜進(jìn)行常規(guī)的反向傳播算法,存在選取不當(dāng)會(huì)導(dǎo)致無法到達(dá)的收斂狀態(tài)的問題,并且學(xué)習(xí)訓(xùn)練周期長(zhǎng),效率較低。為此,研究者提出了新的訓(xùn)練方法,該方法的思路主要為采用自上而下的監(jiān)督學(xué)習(xí)方法調(diào)整參數(shù)、對(duì)每層網(wǎng)絡(luò)進(jìn)行無監(jiān)督學(xué)習(xí)的形式進(jìn)行學(xué)習(xí)、訓(xùn)練,每層網(wǎng)絡(luò)的輸入數(shù)據(jù)都是上一層網(wǎng)絡(luò)的學(xué)習(xí)結(jié)果,這就是分層網(wǎng)絡(luò)。這種訓(xùn)練方法有效的避免了梯度彌散現(xiàn)象的出現(xiàn)。同時(shí),DBN反向傳播算法僅限于搜索部分權(quán)值空間,不需要對(duì)全局網(wǎng)絡(luò)進(jìn)行調(diào)整,這樣就可以節(jié)約大量的網(wǎng)絡(luò)訓(xùn)練時(shí)間,保證了算法的有效率。
(2)深度玻爾茲曼機(jī)。玻爾茲曼機(jī)是1985年由Sejnowski和Hintonti提出的,它是一個(gè)由耦合的隨機(jī)二值單元構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu),采用全連接的結(jié)構(gòu),能夠提高自我學(xué)習(xí)的能力,但是,訓(xùn)練時(shí)間長(zhǎng)、計(jì)算困難成為了玻爾茲曼機(jī)的主要問題。因此,研究者改進(jìn)了算法,簡(jiǎn)化了原玻爾茲曼機(jī)計(jì)算復(fù)雜度。為了學(xué)習(xí)更加復(fù)雜的特征,提高表達(dá)能力,又提出了深度玻爾茲曼機(jī)。深度玻爾茲曼機(jī)能夠從有限的特定數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而調(diào)整無標(biāo)簽輸入數(shù)據(jù)建立的表征。除此之外,DBM采用自下而上和自上而下的兩個(gè)方向的推理和訓(xùn)練,能夠更好的表達(dá)復(fù)雜的和抽象的特征,只是計(jì)算量太大,無法應(yīng)用于大型數(shù)據(jù)量。
4 魯棒級(jí)聯(lián)形狀回歸算法
魯棒級(jí)聯(lián)形狀回歸算法(RCPR)是在級(jí)聯(lián)形狀回歸的算法的基礎(chǔ)上優(yōu)化算法。CPR算法則是把面部特征點(diǎn)定位問題抽象成一個(gè)回歸函數(shù),通過逐個(gè)訓(xùn)練回歸器,使得回歸函數(shù)不斷逼近目標(biāo)的形狀。CPR在人臉數(shù)據(jù)收集上取得了突破性的實(shí)驗(yàn)結(jié)果,但是算法的不足表現(xiàn)在對(duì)初始化形狀敏感,對(duì)姿態(tài)和遮擋的魯棒性太差。PCPR算法克服了上述問題,提高了算法對(duì)姿態(tài)和遮擋的魯棒性。級(jí)聯(lián)形狀回歸算法具有運(yùn)行速度快,計(jì)算復(fù)雜度小的優(yōu)點(diǎn),但是該算法對(duì)初始化形狀過于敏感,對(duì)初始值選擇不當(dāng)會(huì)在很大程度上影響定位效果。雖然多次測(cè)試能夠在一定程度上緩解這個(gè)問題,但相應(yīng)的增大了運(yùn)算量。此外,人臉出現(xiàn)姿態(tài)變化或受到遮擋時(shí),定位效果不明顯。在PCPR算法中,采用智能重啟技術(shù)解決了對(duì)形狀初始化敏感的問題,采用遮擋檢測(cè)避免了遮擋對(duì)定位的影響。
5 多任務(wù)深度卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的魯棒定位算法
多任務(wù)深度卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的魯棒定位算法把機(jī)器學(xué)習(xí)中的多任務(wù)學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來定位表情關(guān)鍵點(diǎn),解決了現(xiàn)有的深度人臉表情關(guān)鍵點(diǎn)定位算法中對(duì)姿態(tài)變化和遮擋魯棒性較差的問題。這種方法把人臉表情特征點(diǎn)定位作為主要任務(wù),人臉屬性和頭部姿態(tài)識(shí)別作為輔助任務(wù),把深度卷積神經(jīng)網(wǎng)絡(luò)和不同的任務(wù)學(xué)習(xí)難度相結(jié)合,能夠提高人臉特征點(diǎn)定位對(duì)于遮擋和姿態(tài)的魯棒性。
6 結(jié)語
現(xiàn)代科技發(fā)展中最具有技術(shù)性的信息傳遞方式就是面部表情,能夠及時(shí)反映出人們最真實(shí)的內(nèi)心情感,起到相互溝通交流的作用。本文針對(duì)人臉表情識(shí)別技術(shù)進(jìn)行了深入的探討,其主要采用了深度卷積神經(jīng)網(wǎng)絡(luò)中具有映射作用的方法,通過此方法對(duì)使用者進(jìn)行了面部關(guān)鍵點(diǎn)定位計(jì)算,還與傳統(tǒng)的面部關(guān)鍵點(diǎn)計(jì)算進(jìn)行了比較,最終研發(fā)出了提出了魯棒表情關(guān)鍵點(diǎn)定位算法。但由于人臉姿勢(shì)和遮擋變化多樣,實(shí)驗(yàn)數(shù)據(jù)有限,基于深度學(xué)習(xí)的魯棒性關(guān)鍵點(diǎn)定位算法設(shè)計(jì)還有很大的研究空間。
Abstract:This paper makes an in-depth study of facial expression recognition technology. It mainly uses the mapping method in the deep convolution neural network. Through this method, the user's face key point location is calculated. Finally, the key point positioning algorithm of robust expression is proposed.
Key words:deep learning; robust expression; key points; localization algorithm.