傅栩雨 葉健東 王鵬 曾穎森
(北京郵電大學,北京海淀 100876)
人臉面部表情識別
傅栩雨 葉健東 王鵬 曾穎森
(北京郵電大學,北京海淀 100876)
近年來交互,智能成為了大家很關注的問題,人臉表情識別是人工智能中有重大意義的一部分,通過面部情緒的識別,增進人機交往的友好性和智能性。本文講述了情緒識別的完整過程,從攝像頭的實時影像中開始到最后實現情緒識別,顯示識別結果。不單一地側重某一部分內容,而進行整體過程的勾畫。同時將涉及到的多方面內容從原理到應用講逐個講解,點明使用的具體方法,結合實際應用過程對功能相近的模塊進行選擇和對比。
表情識別;主動形狀模型;局部二值特征;級聯分類器;主動表觀模型
指紋,虹膜,人臉等人與生俱來的信息越來越多的應用到身份認證的過程中。由于計算機的工作能力,早期這些信息只是小部分的被使用。人工智能的發展,對這類信息的處理利用提出了更高的要求。
計算機以人為服務對象而被廣泛使用,隨著計算機技術的發展,操作越來越復雜,功能越來越多樣,但在取得這些進步的同時犧牲了用戶使用的舒適度和友好性,人機交互成為一個重要課題。在人機交互的過程中,人們不再滿足于通過鼠標鍵盤等物理介質實現對計算機的控制和交流,希望計算機可以對人的語言、肢體動作、表情作出自然地反應。要實現這樣的需求就需要計算機可以更好的理解用戶的行為,最好能夠賦予計算機人的情感和判斷,因此人臉情緒是別對人機的良好交互有著重要意義。
情緒是一種重要的心理活動,情在緒的表達中語言占有7%,語音占38%,面部表情占55%,因此對表情的分析可以使計算機更好地揣度人的情緒,作出期望的反應。識別表情對計算機來說不是一件容易的事情,表情是通過面部肌肉的運動實現的,由幾十塊肌肉共同作用產生產生。同一個人在不同的情景下,同一種表情的表達方式也會有差別,不同的人的表情更是千差萬別,很難以統一的標準來判斷。同時,人眼的識別能力遠遠高于計算機,計算機能否在短時間中捕捉到特征,以什么為特征,又是一大問題。
表情識別又是一個結合心理學、生理學、計算機視覺、模式識別的交叉課題。研究意義重大,應用廣闊。
(1)haar-like特征的計算
如下圖所示的就是haar-理科特征,由黑白的矩形區域構成。Haar-like分為以下四種,邊緣特征、線性特征、中心特征和對角線特征,選取下面的兩到三種特征構成一個模板,規定這個模板的特征值為白色區域像素和減去黑色區域像素和。這樣的一個模板就將圖片信息轉化為數字信息,其實質上體現出來的是在一定區域類圖片灰度值變話的情況。改變模板的大小與位置,在子窗口中與目標圖像對應,每種組合(由模板的種類,大小,位置構成)方式都可以得到一種haar-like特征。圖(1)顯示了基連的原理。

圖1 級聯原理
(2)強分類器級聯
通過模板的簡單組合構成弱分類器,再通過改變每種模板的權值生成強分類器。強分類器級聯,各個強分類器之間存在與的關系,并具有樹狀結構。比如得到的強分類器的的識別率為98%,拒絕率(可以通過非人臉的概率)為50%,在10個強分類器級聯的情況下能夠得到P(通過)=(0.98)^10=0.87,P (拒絕率)=0.0009766。在實際運用過程中識別的最主要問題是將非人臉的部分判斷為人臉,在使用級聯的情況下可以很大程度上,可以很大程度上降低拒絕率。
(3)加快人臉檢測速度
在實驗過程中,為了加快檢測到人臉的的速度,并且考慮到在動態的過程中,人臉不可能在屏幕上產生瞬時的長距離移動,我們采用了保存上一步檢測人臉區域的方法。第一次檢測到人臉的區域如圖(2)綠色方框所示,第二次擴大上一方框在圖(3)所示的方框內檢測人臉,免除了一些重復的步驟。

圖2 第一次檢測

圖3 第二次檢測
(1)模式識別主要兩類分類原理
第一種主要方法是主成分分析法,我們平時收集到的信息,是一種混疊狀態的信息,各個特征模式的分量都具有相關性,這樣進行數據處理就會重復進行很多無意義的計算。通過主成分析法分析法將變量分為多個因子,通常處理對所有因子都進行操作,主成分分析法將因子對的特征根直接(可以用spss對因子特征根進行計算)按照大小排列,取影響大的提高權,是一種降維的方法。LBP部分提到的旋轉LBP算子和LBP等價模型在一定程度上來說也是一種降維的處理方法。
第二類也就是SVM采用的分類原理,升維的分類方法。低維無法進行分類的情況,換到高維空間就可以找到更好的邊界。
(2)SVM分類器
SVM是功能強大的分類器,可以解決分類問題和回歸問題,使用了kernel trick進行數據轉換。SVM在輸入(得到的LBP特征)間找到最好的區分邊界,再將它找到的邊界與輸入的標簽對比,最后確定邊界的可靠性,我們主要運用到的是分類問題,在opencv中可以使用其自帶的SVM庫。
視覺是信息在人的交往過程中占的比重非常大,人的語言在一些情況下誤導性很高,表情是人情緒的一種直觀表示,在世界范圍都具有很高的共性人臉情緒識別在人工智能,人機交互方面有很廣闊的運用前景。
參閱文獻
[1]Robert laganiere.opencv2計算機視覺[M].北京:科學出版社,2013.
[2]毛峽.人機情感交互[M].北京:科學出版社,2011.
[3]李樹娟.基于LBP特征的人臉表情分析[M].
[4]July.支持向量機通俗導論[M].
Facial Expression Recognition
FU Xu-yu,YE Jian-dong,WANG Peng,ZENG Ying-sen
(Beijing University of Posts and Telecommunications,Beijing 100876,China)
In recent years,interaction and intelligence are issues attracting more and more attention.Facial expression recognition,as a significant part of artificial intelligence,enhances the friendly and intelligent human-machine interaction through facial emotion recognition.The paper describes the complete process of emotion recognition from the real-time images of camera to the final realization of emotion recognition and result display.The paper outlines the whole process instead of solely focusing on a part of the content.And the multiple aspects of content involved are introduced one by one,from theory to application.The specific methods of use are pointed out,and the modules with similar functions are selected and compared based on the practical application process.
facial expression recognition;active shape model;local binary characteristic;cascade classifier;active appearance model
TN971
A
1008-1739(2015)10-70-2
定稿日期:2015-04-26
北京郵電大學大學生創新基金資助