宋俊芳 西藏民族大學信息工程學院
面部表情識別可以為人機智能交互的可靠性和準確性提供可靠的保證。人臉表情信息豐富,常見的基本表情有生氣(anger),厭惡 (disgust),恐懼 (fear),開心 (happiness),中性 (neutral),悲傷(sadness),驚訝(surprise)。在現實生活中,準確把握人臉面部表情,對于遠程教學系統,駕駛員安全駕駛等情況,有著相當重要的意義。
輸入的靜態面部圖片通常是不統一的非規則圖片,需要先進行圖像預處理,這里采用小波變換處理方法。先將人臉表情圖像分解成相互關連的四幅表情圖像,即低頻圖像,水平高頻圖像,垂直高頻圖像和對角斜線高頻圖像;然后對這四幅圖像進行重構,在重構每個分解圖像時,將其他三種分解圖像置為零,最后就可以得到與原圖像大小一致的表情圖像,該圖像不僅對原始圖像信息做了很好的保留,還將人臉的眼睛,鼻子,嘴巴等部位的特點更加精確細膩地表達了出來。之后對人臉表情重構圖像采用LBP算法進行紋理特征提取,用于表情分類。
稀疏表示方法是目前較為流行的二分類機器學習算法 ,具體原理如下:

上等式通常是超定的,我們可以通過L0范數來求解其稀疏解


考慮到噪聲的影響,稀疏表示模型可以被改寫為

給定一個某表情類別中的測試樣本y,通過上面的(3)或者(5)兩個公式,首先求得測試樣本的稀疏解,其中非零的元素將對應于矩陣A中的某一列,也就是某一類,然后該測試樣本就可以歸結為此類。
但是,由于噪聲和模型誤差的影響,很可能使得一小部分非零的元素與多個類別有關,在這樣的情形下,我們選擇在所有的訓練樣本來表示測試樣本y的系數里面相關性最好的。為此對于每個類別i,建立一種特征映射關系,讓,選擇與第i類相關的系數。假如對于是一個新的向量,這樣就使得中的非零元素與第i個類別相一致。

先針對原始JAFFE表情庫和AR表情庫進行測試。JAFFE表情庫庫中包含了213幅(每幅圖像的分辨率:256像素×256像素)日本女性的人臉表情圖像。AR人臉數據庫是由126名志愿者(70名男性和56名女性)的超過4000張的彩色人臉圖像構成,每幅圖像的分辨率為256像素×256像素。圖1為表情庫中的部分原始表情圖片,從左到右表情依次為高興,中性,悲傷,驚訝,恐懼,厭惡,生氣。

圖1 原始圖像
下表1為JAFFE表情庫和AR表情庫上中進行表情識別準確率的統計結果。

表1 JAFFE表情庫和AR表情庫上識別準確率對比
從結果中看出,本文的修正LBP算法加稀疏表示識別人臉表情效果較好,尤其對于尖叫驚訝表情,其面部特征明顯區別于其他三種表情,所以取得了最好的識別效果。
為進一步驗證本文方法的魯棒性,對不同程度高斯噪聲污染之后的表情圖像進行了測試,圖2是高興表情添加不同方差的高斯噪聲后的圖片,從左到右添加方差大小依次為0.001,0.005,0.01,0.05,0.1,0.5。

圖2 添加高斯噪聲后的高興表情圖像
從圖中看出,噪聲較大時,面部表情已變得極為模糊,這給識別帶來一定的難度,但用本文方法仍達到了較高的準確率,表3是對兩個表情庫中所有高興表情分別添加不同的方差噪聲之后識別的統計結果。

表3 添加高斯噪聲后表情識別結果對比
由上表數據分析可知,本文識別算法在0.1方差噪聲干擾下,高于50%的識別準確率,表現出了較好的魯棒性。
[1]Darwin C.The Expression of the Emotions in Man and Animals[M]. John Murray: reprinted by University Chicago Press , 1872.
[2]蔣斌,賈克斌,楊國勝.人臉表情識別的研究進展[J].計算機科學,2011,38(4), 25-31.
[3]左坤隆.人臉表情自動分析與識別系統的研究[D]. 天津大學2004.
[4]房德峰.淺談改進的LBP算法[J].現代企業教育.2013(16).
[5]趙曉.基于稀疏表示的人臉識別方法研究[D].北京工業大學,2013.
[6]李志星.基于圖像特征的稀疏表示人臉識別算法研究[D]. 燕山大學,2012.