朱海榮

摘 要 活體檢測是一種驗證對象真實生理特征的技術,隨著人臉識別技術在支付、門禁、移動設備等的廣泛應用,人們對人臉識別的安全性也提出了更高的要求,活體檢測技術也越來越被重視,其可有效抵御屏幕錄制的照片、視頻、打印的照片、立體假面等攻擊手段,甄別欺詐行為,保障用戶利益。本文通過深度學習中卷積神經網絡(CNN)的分類網絡,提供一種簡單高效、識別率高、可擴展行強的靜默活體檢測方法。并提出了一種小區域特征對齊圖像提高活體檢測準確度和魯棒性的方法。
關鍵詞 活體檢測;深度學習;靜默;特征對齊
活體檢測技術早期采用配合式檢測方法,需要檢測體按照提示配合眨眼、張嘴、搖頭、點頭等組合動作,使用人臉關鍵點定位技術判斷動作的正確性來決定是否為活體操作,進一步決定終止或繼續人臉識別過程。此方式的缺點:檢測時間長,對檢測體要求高,不適應門禁、閘機等要求快速完成檢測的場景。靜默活體檢測不需要煩瑣的臉部動作配合,根據真實人臉成像和照片、屏幕、面具成像的差別判斷是否活體。照片、屏幕成像會出現摩爾紋,并且紋理和光線反射率和真實人臉差異較大,通過讓機器捕捉學習這個特性準確完成活體檢測,并且每幀圖像都可檢測得到結果,檢測過程短、實時性強。
1設計思路
為了讓機器學習到偽造圖像和真實活體圖像的區別,而不受人臉個體差異的影響,提高魯棒性,需要把學習和檢測的圖像特征對齊、減少干擾內容、有較多的可用特征、減小圖像區域。
1.1 圖像特征對齊
活體檢測圖像位置一致,獲取人臉相同區域圖像,使機器學習的特征單一,學習收斂速度快,特征提取準確。獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓練和檢測圖像。
1.2 減少干擾內容
活體檢測圖像減少人臉干擾圖像內容,減少因個體差異而影響檢測結果,盡量減少眼、鼻、嘴等個體差異圖像內容,保留皮膚紋理等個體差異小的圖像特征。
1.3 有較多的可用特征
活體檢測圖像要保留較多的可用特征,比如摩爾紋、反光、紋理等可用作檢測判斷的特征盡量保留,提高機器學習準確度[1]。
1.4 小區域圖像
小區域圖像在經過預處理縮小圖像和后期的池化層后保留較完整的可用特征。
2訓練過程
2.1 模型設計
模型輸入為3層24寬24高的RGB圖片輸入,歸一化到[-1,1]之間,進過4個卷積層加兩個全連接層,輸出一個代表活體和非活體的二分類張量。使用Softmax loss作為損失估算函數,增加Accuracy進行準確率測試。
2.2 素材采集
將視頻或者圖片通過人臉檢測獲取人臉和關鍵點位置,使用雙眼位置和嘴的中心位置,獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓練和檢測圖像。按照真實人臉和偽造人臉分類保存采集的圖像。
2.3 預處理
將采集的圖像縮放(Resize)處理到3x24x24,并歸一化數據到[-1,1]之間,保存到各自的分類目錄中。
2.4 訓練
將分類保存的數據集按照7:3的比例分成訓練集和測試集,使用較為流行的深度學習訓練工具Caffe、TensorFlow或者Pytorch訓練。訓練中可以發現在迭代5000次后損失值快速減小收斂,并且準確率可達到99%以上[2]。
2.5 結果
進過10萬次迭代的訓練,發現損失基本穩定在0.0001±0.0005,準確率達到0.999±0.0005。結束訓練。
2.6 應用
由于模型深度淺,輸入圖像小,推理速度在Arm A53 CPU上達到15fps,在帶有NPU的Rk1808上達到150fps。
3優缺點對比
3.1 優點
訓練圖像和推理圖像特征對齊,干擾較少,訓練收斂速度快,準確率高;模型小,推理速度快,可在移動設備上部署,正常運行;靜默檢測,無須檢測體配合動作,檢測時間短,檢測速度快;推理圖像只保留相關的可用特征,減少了干擾特征,魯棒性高,泛化能力強,無須不同人員的大量素材訓練。
3.2 缺點
由于依靠人臉檢測技術的關鍵點進行特征對齊,在關鍵點不準確的某些場景下,活體檢測能力有所下降;在強光下由于圖像過曝,圖像特征缺失,或者弱光場景下噪點干擾,活體檢測能力有所下降,可通過改用近紅外攝像頭改進對環境光的影響[3]。
4結束語
綜上所述,本文提供的基于深度學習的小區域特征對齊的活體檢測方法,檢測速度理想、魯棒性高,可在各種移動設備上部署,并為人臉識別的安全性和體驗性提供了保障。
參考文獻
[1] 李新豆.基于圖像擴散速度模型和紋理信息的人臉活體檢測[J].計算機科學,2020(2):112-117.
[2] 黃海新.基于深度學習的人臉活體檢測算法[J].電子技術應用,2019(8):44-47.
[3] 宛根訓.人臉識別應用活體檢測技術研究[J].中國安全防范技術與應用,2019(6):58-62.