

摘? 要:針對當前人臉識別技術在大型人臉圖形數據庫研究應用存在的兩大問題,一是批量處理人臉圖像數據效率低;二是一種算法只對某一類人臉圖像庫有較好的處理效果,沒有一種通用的處理算法,提出了基于分布式運算的多網格索引人臉識別方法,介紹了其模型結構、核心算法以及優點特色,對于人臉識別方法的研究和應用具有一定的借鑒價值。
關鍵詞:人臉識別;分布式;多網格索引;模型;算法
0? ? 引言
隨著網絡技術和人工智能技術的迅速發展,人臉識別作為一種身份識別的重要手段,成為當前人工智能領域的研究熱點。人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術,用攝像頭采集包含人臉的圖像或視頻流,并通過相關的算法自動在圖像或視頻流中檢測人臉,獲取人臉的位置信息,再對人臉進行特征提取、特征比對、輸出人臉信息等一系列相關操作[1]。目前,人臉識別技術廣泛應用于智能門禁、公安刑偵、商業金融、信息安全等領域,具體包括大規模人臉檢索,幫助公安尋找罪犯;考勤打卡,門禁進出;公共商業場所的自助服務;手機支付、身份識別;信息安全管控等。但是,人臉識別技術還并不算成熟,人臉檢測與識別的速度和準確度仍然是研究重點。
1? ? 國內外研究現狀
國外對人臉識別的研究可追溯到20世紀60年代,牛津大學、卡內基梅隆大學、麻省理工學院、斯坦福大學、美國陸軍研究實驗室等研究機構提出了很多著名的人臉識別算法,比如幾何特征算法、特定人臉子空間(FSS)算法、可變形模板法、基于神經網絡的方法、基于深度學習的方法等[2]。
國內對人臉識別的研究雖然起步較晚,但也取得了不錯的成就,已經掌握了一定的核心技術,達到了國際先進水平。研究機構主要有清華大學、香港中文大學、中國科學院自動化研究所等高校和科研院所,還有百度、騰訊、曠視科技、商湯科技、科大訊飛等企業。中國科學院自動化研究所提出了Webface理論,并公布了生成的人臉數據庫——CASIA-Webface數據庫,香港中文大學湯曉鷗教授研究組提出了著名的Deep ID算法,這些都為人臉識別技術研究做出了很大貢獻[2]。
2? ? 人臉識別技術存在的問題
人臉識別技術對大型人臉圖形數據庫的識別還存在兩大關鍵問題:一是對海量人臉圖像數據的處理能力。目前,識別率較高的人臉識別技術基本都采用深度學習方法來實現,雖然深度學習能得到較高的人臉識別準確率,但是學習效率并不高,不能滿足高吞吐率、高容錯性和實時響應的要求,直接運用到人工智能領域進行實時交互依然存在著較大問題。二是在不同光照、姿態和復雜背景等條件下,人臉識別算法存在魯棒性問題,即某一種算法只對某一類人臉庫有較好的處理效果,而沒有一個通用的處理算法。
3? ? 基于分布式運算的多網格索引人臉識別方法
為在提高人臉識別準確率的同時達到較高的批量識別處理效率,本研究團隊提出了“基于分布式運算的多網格索引人臉識別”方法,并進行研究實驗,取得了較好的效果。分布式運算是把多種算法集成調用進行計算。利用網格技術建立一個通用的、協同的、智能的虛擬處理平臺以充分利用和共享各種資源,提高處理速度和能力,實現資源共享,包括數據資源、計算資源等,從而有效利用閑置資源。對于大型人臉庫的人臉識別中存在的兩個關鍵問題,前者可以通過基于網格的分布式數據庫,把大型人臉圖像庫劃分為中、小型人臉圖像庫,并借鑒計算網格、數據網格以及Globus等的實際應用來解決;后者可以基于應用共享的網格來實現,最后統一集成到一個虛擬處理平臺下[3]。
3.1? ? 方法模型
基于分布式運算的多網格索引人臉識別方法包含了圖片預處理、人臉多姿態的分析與識別、多種算法融合進行人臉深度編碼、多網格計算大規模人臉數據庫這幾個方面,其模型如圖1所示。
具體過程是運用多張照片對人臉進行多層次的學習和訓練,通過分布式運算的多網格索引多類別的數據算法進行權值特征提取,利用人臉深度,訓練出人臉更高層次的編碼。首先稀疏提取人臉特征點及環境特征點,對人像圖片預處理,根據圖片的特征進行分類,建立索引,增加人臉特征。采用強化學習(Deep Q Network)對多種姿態人臉進行猜想及還原,前期數據分類及索引后,經線性分析和判斷,人工智能對數據訓練和調優,最后通過多類別的數據算法進行權值特征提取,再利用人臉深度,訓練出更高層次的編碼,找出最接近正常姿態的人臉,從而提高在多環境、多姿態下的識別率,減少了人臉識別受到的尺寸、環境光線、多姿態、飾品等不穩定因素的影響,提高識別準確率的同時,也提高了大批量處理的識別速度。
(1)預處理。照片通過PC或移動應用端攝像頭獲取后被送入數據處理中心,通常為GPU進行圖像分類處理及壓縮,并行大規模運行。稀疏提取人臉特征點及環境特征點,對人像圖片進行預處理,通過特征進行分類建立索引,從而增加人臉特征,減少環境光及不穩定因素對人臉圖片的影響。
(2)人臉多姿態的分析與識別。常規人臉識別技術應用于多姿態的人臉識別存在多種問題,容易受尺寸、環境光、姿態的影響。為了在不同的姿態下更精準地識別人臉,本方法主要利用強化學習(Deep Q Network)來對多種姿態的人臉進行猜想和還原,通過前期數據的分類及索引,然后進行線性分析和判斷,再通過人工智能進行數據訓練和調優,找出最接近正常姿態的人臉,最后進行常規的人臉處理。
(3)多種算法融合,人臉深度編碼。大多傳統的深度學習只是在平面上對人臉進行學習、訓練和編碼。本方法運用大量照片對人臉進行多層次的學習和訓練,通過多種類別的數據算法進行權值特征提取,然后利用人臉深度,訓練出人臉更高層次的編碼,從而提高人臉識別的精度。
(4)多網格計算大規模人臉數據庫。利用數據網格的分布處理策略,構成一個分層樹形結構的人臉識別網格。將待識別的人臉圖像及與其有關的信息以任務的形式提交給人臉識別網格,網格將所提交的任務逐級分解到最低層的計算中心和計算節點上,并根據大規模人臉數據庫的劃分準則產生符合條件的中小型人臉數據庫,計算中心通過融合各計算節點上的多種算法的識別結果即可獲得最終的識別結果,可以有效地解決大規模人臉數據庫人臉識別計算耗時的問題。
3.2? ? 核心算法
算法是整個系統的核心,通過不同算法的結果,取得相應的權值,最終通過人工智能學習,獲取不同權值的組合,來判定其準確率。
分布式算法集群每種算法對應不同的模型,預先經過檢索分類,針對不同的服務獲取數據,將大量需處理數據分布到不同算法區間,每種算法初期的權值各不相同;同時對大批量照片進行人臉識別,根據獲取人臉的數據特點,將照片分類到不同算法的特定模型中,其結果可快速反饋到前端。通過大量數據的喂養,每種算法的權值經過不斷的調整、修訂、反饋、再調整,逐漸提升識別準確率和識別速度。核心算法如圖2所示。
4? ? 特色和優點
(1)升維識別。本方法運用了人臉深度編碼,脫離了傳統的平面的人臉編碼和識別。結合強化學習(Deep Q Network)來預測及還原多姿態和多環境下人臉的正面圖,將二維(2D)推向了更多特征點的三維(3D)人臉,人臉更加立體化,增加了人臉關鍵點,可以對小部分或者殘缺的人臉圖片進行識別,更全面地還原人臉。
(2)提高了運算速度。分布式運算把需要非常巨大的計算能力才能解決的問題分成許多小的部分,然后分配給許多計算機進行處理,最后把這些計算結果綜合起來,得到最終的結果。本研究提出的多網格分布式運算模式,先對圖片按特征進行預處理并進行索引分類,再經過線性分析和判斷,基于人工智能對數據進行訓練和調優,最后通過多類別的數據算法進行權值特征提取,再利用人臉深度,訓練出更高層次的編碼,送入對應的一種或多種算法同時進行處理,大大提高了運算和數據前后反饋比對矯正的速度,實現了大批量圖片的高速同時識別。
(3)通用性強,可應用并產生效益的場景較多。此算法程序可直接集成到硬件設備,或者嵌入到所需系統或App應用程序里,供多種場合使用。
[參考文獻]
[1] 胡亞洲,周亞麗,張奇志.基于深度學習的人臉識別算法研究[J].計算機應用研究,2020,37(5):1432-1436.
[2] 王震.基于深度學習的人臉識別方法的研究[D].蘭州:蘭州理工大學,2018.
[3] 張迪.基于網格計算技術的人臉識別研究[D].重慶:重慶大學,2007.
收稿日期:2020-06-29
作者簡介:張子容(1984—),女,四川簡陽人,碩士,講師,主要從事機械電子控制工程、工業機器人技術方向的教學和研究工作。