田桂 謝凱
摘要:為提高視頻人臉檢測的準確性,我們提出了LSTM-RBM-NMS模型下的視頻人臉檢測方法。該模型首先利用公開的視頻人臉數據集輸入長短期記憶網絡(Long Short-Term Memory, LSTM)網絡中,在 LSTM網絡中加入批量歸一化(Batch Normalization, BN)算法,在預訓練的模型中,采用受限玻爾茲曼機代替全連接層。然后將預訓練好的模型去除softmax分類器,使用支持向量機(Support Vector Machine, SVM)分類器進行代替,最后采用非極大值抑制算法消除多余的窗口,最后得到視頻人臉檢測結果。實驗結果表明,通過使用本文提出的LSTM-RBM-NMS模型,與傳統的視頻人臉檢測方法OpenCV和Viola Jones(VJ)相比,在相同閾值的情況下,視頻人臉檢測準確率提高了3.3%~10.4%。
關鍵詞:視頻人臉檢測;長短期記憶網絡;批量歸一化算法;受限玻爾茲曼機;非最大抑制算法
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2019)04-0176-02
目前用戶進行身份驗證的方法主要是基于PIN模式的,這只在初始登錄期間提供身份驗證。用戶在注冊時設定的密碼,很容易被網絡攔截,進而被黑客破解,因此使用密碼進行用戶身份認證是極其不安全的。近年來,使用生物特征進行用戶認證已經成為主流,例如基于觸摸手勢的系統、基于人臉的系統[1]和基于語音系統。近年來,隨著硬件設備更新地越來越快,對機器學習領域中的深度學習的探討已經成了一種潮流。目前圖像處理最好的算法就是深度學習。與之相比,深度學習則能自動地對特征進行提取和表示,而且一個高效的神經網絡框架可以對抽象物體進行解釋和分析。近十年來,許多學者對深度學習[2]的算法性能進行了優化,設計了卷積神經網絡的最優結構框架。例如,Matthew Zeiler和Rob Fergus在神經網絡中加入了批量歸一化算法[3],它是一種非常有效的深度學習技術,極大地加快網絡收斂的速度。然而,近年來一些研究學者逐漸從圖像處理領域研究到視頻處理領域,與靜態圖像人臉檢測相比,視頻中的人臉具有更多的空間信息,包括無約束的姿態變化、光照變化、對象遮擋等。一些傳統的視頻處理方法可以在受限場景下工作,但無法處理各種變化的復雜場景。視頻人臉的處理非常復雜。而長短期記憶網絡[4]是針對視頻處理提出的。根據以往的研究證明,深度學習在語音識別、人臉識別、圖像分類、目標檢測[5]等領域取得了重大進步。
1 本文模型
針對視頻中的人臉檢測,本文采用長短期記憶網絡進行特征提取,本文的模型如圖1所示。
我們將公開視頻數據集分為訓練集和測試集,采用訓練集進行訓練LSTM網絡,在訓練的過程中,加入歸一化層,加快訓網絡的收斂速度,同時使用隨機池化層進行降維。我們采用RBM代替全連接層,進一步對提取的特征向量進行降維,這樣就可以減少計算代價。我們將預訓練好的模型,移除softmax分類器用于視頻人臉的測試集上進行提取人臉的深度特征,將這些特征采用SVM分類器進行分類,SVM分類器泛化能力強,精度高。最后采用非最大抑制算法去除交叉重復,最后得到視頻人臉檢測的結果。
2 實驗結果和分析
本文采用兩個公開的數據集,即YouTube視頻人臉數據集和IJB-A視頻人臉數據集。我們知道人臉檢測,閾值的選擇是非常重要的。因為閾值的大小將會影響人臉檢測的準確性,所以分別選擇不同的閾值來進行實驗。根據圖2,我們可以看出,準確率與人臉檢測閾值成反比,即隨著人臉檢測閾值的增大,準確率反而呈現下降趨勢。
從圖中可以看出,值得注意的是閾值在0.1處時,人臉檢測的準確率最高,而在0.3到0.5之間,可以看出準確率下降的最快。在相同的閾值條件下,本文方法比其他方法具有更高的準確性。
3 結論
本文提出的LSTM-RBM-NMS模型下的視頻人臉檢測方法,我們采用公開的兩個數據集預訓練的LSTM網絡,同時加入歸一化算法,加快了網絡的收斂速度,采用RBM替換全連接層,降低了特征維度,即減少了計算代價,將預訓練好的模型去除softmax分類器,采用SVM分類器替代用于檢測的視頻人臉幀上,,采用非最大抑制算法,獲得最好的人臉檢測區域,與傳統的方法相比,該模型極大地減少了網絡參數,加快了視頻人臉檢測的速度,同時提高了視頻人臉檢測的準確率。
參考文獻:
[1] 廖延娜,馬超.基于稀疏表示的人臉識別系統設計與實現[J].電子設計工程,2016,24(17):153-155.
[2] 丁冬兵.TL-CNN-GAP模型下的小樣本聲紋識別方法研究[J].電腦知識與技術,2018(24).
[3] 張杰,陳懷新.基于歸一化詞頻貝葉斯模型的文本分類方法[J].計算機工程與設計,2016, 37(3):799-802.
[4] 陳斌,周勇,劉兵.基于卷積長短期記憶網絡的事件觸發詞抽取方法[J].計算機工程,2018(9).
[5] 李旭冬,葉茂,李濤.基于卷積神經網絡的目標檢測研究綜述[J].計算機應用研究,2017, 34(10):2881-2886.
【通聯編輯:唐一東】