魏震宇,文 暢,謝 凱,賀建飚
(1.長江大學 計算機科學學院,湖北 荊州434023; 2.長江大學 電子信息學院,湖北 荊州 434023;3.中南大學 信息科學與工程學院, 長沙 410083)(*通信作者電子郵箱wenchang2016paper@163.com)
移動設備上的實時人臉檢測是人臉識別的一個重要發展方向。人臉檢測的應用領域也由經典的靜態圖像向連續的視頻幀發展。受性能限制,移動設備上的人臉檢測往往存在速度較慢難以滿足實時檢測需求、檢測精度差的問題,從而需要設計一種高效的移動設備人臉檢測算法。人臉檢測問題是屬于圖像識別中目標檢測的一個分支,傳統的檢測算法都是以多張人臉為目標在圖像上進行檢測。現有的人臉檢測算法分為以維奧拉-瓊斯(Viola-Jones, V-J)目標檢測框架[1-2]為代表的經典機器學習方法和使用卷積神經網絡進行檢測的深度學習方法兩大類,這兩類方法都是針對單張靜態圖片設計的,并不能很好地適應視頻實時檢測的需求。
Viola-Jones目標檢測框架利用AdaBoost方法[3]訓練級聯分類器,能進行快速靜態人臉檢測,也是現有大多數工程采用的方法,開放視覺庫OpenCV[4-5]中就有一種具體實現。但OpenCV實現的算法主要缺點是誤檢率高[5],不能很好地滿足精確度要求。
針對Viola-Jones方法檢測率低的問題,出現了應用卷積神經網絡(Convolution Neural Network, CNN)[6-8]來進行人臉檢測的方法,通過利用局部感知和權值共享的卷積神經網絡進行特征提取并加以分類,使利用CNN進行人臉檢測在20%誤檢率下召回率普遍達到了87%以上[9-10];但由于CNN高昂的計算代價,往往只能應用在單張靜態圖像上,不能進行實時視頻檢測。……