王晨星 梁宇



摘要 本文提出了一種人臉表情識別的方法,首先對人臉表情圖像進行局部二值模式(LBP),然后對編碼后的圖像進行分塊直方圖特征統(tǒng)計,最后采用極限學習機進行分類識別,實驗結果說明本文的算法識別率高、計算速度快、有很大的優(yōu)越性。
【關鍵詞】人臉表情識別 LBP 極限學習機
1 引言
人臉表情識別作為情感識別的一個方面,在人際交流中起到非常重要的作用,不僅是展示情緒,更是傳播情感信息與協(xié)調雙方關系的重要方式,因而人臉識別技術成為當今研究的一個熱點。
人面部表情識別的過程一般包括三個步驟:人臉定位,特征提取和分類識別,而本文的研究重點放在虛線框內所示的特征提取和分類識別步驟,它們決定著誤差的大小即分類識別效果的好壞。
2 面部表情特征提取
LBP的基本思想是:通過固定大小子模塊特征分析,統(tǒng)計得到圖像的整體特征提取。在3x3鄰域窗口T內,可以將像素點分成兩個部分,一個中心像素點g。和與之相鄰的8個像素g0,…,g7。這個窗口紋理T定義為:
T~(g0-gc,…,g7-gc) (1)
對窗口內的八個相鄰像素點以中心像素點ge為基準做二值化操作。其過程為:將中心像素點gc的灰度值設定為閾值,并分別用相鄰8個像素點的灰度值與該閾值比較大小,如果某像素點的灰度值小于或等于中心點的閾值,則標志該像素位置為O;否則,標記為1。二值后的窗口紋理T應表示成
T≈t( s(g0-gc),…,s(g7-gc)) (2)
像素點二值化處理可表示為:
經過公式計算后,該窗口中8個相鄰像素位置得到了8個二進制數,為統(tǒng)一編碼,以十點鐘方向為起點,按順時針方向讀取這8個二進制數,得到一個相對應的二進制模式作為該像素點的矩形塊特征值,按公式將二進制模式轉換為十進制數,就得到該像素點(中心像素點gc)的LBP值,即描述圖像紋理特征的LBP值表示為:
最后對LBP紋理圖像進行分塊直方圖統(tǒng)計,即可獲得本文要使用的LBP特征向量。
3 基于極限神經網絡的人臉識別
Huang等在文獻[2]中提出,前饋神經網絡的輸入層連接權值無需進行訓練,可以隨機設置,當給定了網絡的隱層結點數目和輸入層的連接權值以后,前饋神經網絡的隱層輸出矩陣H就變成了一個己知的矩陣,只需要求出輸出權值β的正則化最小二乘解就可以完成對網絡的訓練。
極限學習機具有速度極快,泛化性良好,參數選擇簡單的特點,相對BP網絡,支持向量機等算法具有很多優(yōu)勢,已經取得很多應用。
4 實驗分析
本實驗采用JAFFE表情數據庫為數據基礎。表情數據庫JAFFE是日本ART建立的10個日本女人的表情,示例如圖1,從左至右依次為驚訝、悲傷、害怕,生氣、厭惡,高興和中性。
將本文的LBP算子特征結合ELM分類的方法,和Gabor特征ELM分類方法以及LBP-SVM算法、LBP-BP算法進行對比,實驗結果如表1所示。
從表1中的對比結果看可以看出本文的LBP特征ELM分類的方法取得了最佳的識別精確且消耗的時間最短,這也說明了本文算法是十分有效的。
5 結論
本文主要研究基于LBP特征并結合極限學習機算法的人臉表情識別,并且其他算法的識別性能進行了分析對比,實驗結果表明本文的算法識別率高,計算速度快,優(yōu)于對比算法。
參考文獻
[1]王大偉,周軍,梅紅巖,張素娥.人臉表情識別綜述[J].計算機工程與應用,2014, 50(20):149-157+181.
[2] Guang-Bin Huang, Qin-Yu Zhu andChee--Kheong Siew. Extreme LearningMachine:Theory and Applications [J].Neurocomput ing, 2006, 70 (1-3): 489-501.
[3]許學斌,管曉宏,鄧萬宇等,基于多分類投影極速學習機的快速人臉識別方法[J].微電子學與計算機,2012, 29 (07):14-17.
[4] Weiweizong, Guang-BinHuang. FaceRecognition based on extremelearning machine [J]. Neurocomputing, 2011, 74: 2541-2551
[5]Michael J L,Julien Budynek, ShigeruAkamat su. Au toma tic
Clas sificationof Single Facial Images [J].IEEE Transactions on PatternAnalysis and Machine Intelligence,1999,21(12):1357-1362.