劉宣彤
摘?要:在“互聯網+”技術的發展推動下,人臉識別技術也逐漸趨于成熟,但是面部表情識別技術作為難點技術,尚未被有效攻克,如果將面部表情識別技術與物聯網技術相結合,則會賦予計算機以人類的感情,有利于物聯網時代的開啟。本文通過對面部表情識別方法進行分析,希望對促進面部表情識別技術的發展有所幫助。
關鍵詞:深度學習;面部表情;識別
面部表情是一種人類特有的情感表達方式,也是分析人類情感和行為的重要依據,在“互聯網+技術”和人工智能技術發展的背景下,面部表情識別技術已經成為人們重點關注的話題,并出現了多種識別方法。伴隨著芯片處理能力的不斷加強,研究人員已經將目光轉向深度學習,已經取得了初步的成效。因此,對基于深度學習的面部表情識別進行研究,具有十分重要的意義。
一、深度學習
深度學習指的是在多層神經網絡上,應用不同種類的機器學習算法,對圖像、文本等問題進行解決的算法集合。[1]基于深度學習,計算機可以對數據結構進行發現和調整,并依據前一個圖層的表示,對每個圖層表示進行計算。深度學習最顯著的特點就是特征學習,其目的在于獲取分層特征信息,以此來解決傳統特征提取方法存在的問題。深度學習就是所謂的深度神經網絡訓練,伴隨著硬件處理能力的不斷提升,重新成為了相關領域重點關注的內容。
二、基于深度學習的面部表情識別分析
(一)面部表情圖像預處理
預處理是面部表情識別的重要步驟,其主要目的在于排除干擾特征提取的各項因素,例如:環境、姿勢和背景等,在干擾排除后,讓人類面部表情直接與系統相對接,促使面部特征對應的語義位置準確無誤。實現預處理的方法有以下幾種:一是人臉檢測;二是人臉對齊;三是數據增強;四是人臉歸一。
1.人臉檢測
人臉檢測主要是對人類的面部進行檢測,在檢測的同時,排除干擾因素和其他區域。傳統的人臉檢測方法主要由人工操作完成,工作人員會利用專業的設備完成這項工作,但是這種檢測方法,無法有效克服環境因素的干擾,檢測效果十分有限。而隱馬爾可夫人臉檢測器應用效果卻十分顯著,取得了廣泛的應用。在深度學習階段,又出現了一系列先進的人臉檢測器,不僅工作效率高,還能應對各種干擾因素的影響。目前,級聯結構的卷積神經網絡的應用,使人臉檢測性能得到顯著增強。
2.人臉對齊
為進一步強化人臉檢測的效果,人臉對齊技術應運而生,人臉對齊好比在一個已經設置好固定點位的系統中,對這些固定點進行搜索,繼而構成人臉的形狀。人臉對齊首先會由一個大致的形狀開始,然后不斷對人臉形狀進行細化和估計。[2]在搜索點的過程中,需要使用以下兩種信息:一是人臉外觀;二是人臉形狀。形狀是指為搜索提供一個大致的范圍,目前使用最為廣泛的方法是IntraFacc軟件。
3.數據增強
深度學習雖然效果十分顯著,但對于數據的要求十分嚴格,只有確保數據量的充足有效,才能強化工作效果。但是現階段常用的FER數據集,卻無法完全滿足深度學習對數據的要求,繼而會導致過擬合現象的發生。因此,數據增強成為了保證面部表情識別有效性的重要步驟。目前,應用效果顯著的數據增強方法有以下幾種:一是旋轉反射變換法;二是縮放變換法;三是尺度變換法;四是對比度變換法;五是顏色變化法。這些數據增強方法的應用,促進了面部表情識別技術的發展。
4.人臉歸一化
由于燈光和頭部姿勢的變化,會對面部表情識別效果造成直接的影響,因此,應用人臉歸一化方法,消除這些變化的對識別效果的影響十分關鍵。常用的人臉歸一化方法為兩種:一是灰度歸一化;二是幾何歸一化。增加圖像的亮度,凸顯圖像的細節,消除外界環境因素對圖像的干擾,是灰度歸一化的主要功能。除了增加亮度功能之外,灰度歸一化還可以調整對比度。對比度調整方法包括直方圖均衡化、IS歸一化、DCT歸一化和高斯歸一化法等。在這些方法中,比較適用于深度學習面部表情識別的方法為直方圖均衡化,究其原因,主要是這種方法較為穩定,契合于網絡模型。幾何歸一化的功能是生成面部視圖,但現階段,該方法的發展還不完善,尚存在一定的不足。
(二)基于序列特征的方法
基于序列特征的方法主要有兩種:一種是光流法;另一種是模型法。其中光流法是指幀在變化過程中會凸顯出來一些重要的特征信息,在明確圖像序列目標的構造的基礎上,對目標的形變和圖像顏色在空間和時間上的變化情況進行把握,這種動態化序列特征提取,應用范圍十分廣泛。而模型法是指利用模型對人的面部進行追蹤,并將通過追蹤獲取的模型和幀圖像信息作為依據,對人的面部表情進行有效的識別。
(三)深度卷積神經網絡
深度神經網絡已經被廣泛應用于視覺對象識別任務之中,它能夠使神經網絡的大數據處理能力得到顯著提升,其方法是在神經網絡內構建一個與人類大腦相似的學習結構。這個學習結構可以對一些多級表示和抽象進行學習,從而賦予計算法在聲音、文字和圖像中找到復雜模式的能力。研究人員在2012年發現將自動編碼器應用于CNN之中,做逐層訓練,可以對高層次的網絡進行訓練,但經過繼續研究,發現初始化策略的效果要優于逐層訓練,因而提出了批量歸一化方法,這一方法的使用,促進了深層網絡的發展,從而使深層學習面部表情識別成為了可能。
三、結論
綜上所述,面部表情識別具有非常高的實用價值和商業價值。如今,對于面部表情識別的研究正在不斷進行,在此期間,產生了多種方法和結構。通過對這些方法進行分析,有利于加深我們對面部表情識別的理解。
參考文獻:
[1]陸嘉慧,張樹美,趙俊莉.基于深度學習的面部表情識別研究[J].計算機應用研究,1-8[2019-03-07].
[2]夏晨.基于視頻序列的人臉表情識別方法研究[D].合肥工業大學,2018.