鄧熠 畢磊 薛甜 范亞江 侯丹
摘 要:人臉識別是一項熱門的計算機技術研究領域,同時也奠定了生物特征識別的研究方向。隨著技術的進一步成熟和社會認同度的提高,越來越多的學者將基于神經網絡的多種深度學習方法結合起來,但在人臉標志檢測方面還存在精度問題,由此提出一種深度卷積神經網絡的訓練方法加以解決。深度學習以多層自編碼神經網絡的方式進行預訓練,進而結合人臉面部信息進一步優化神經網絡權值的深度置信網絡(DBN)。文章基于深度學習人臉識別發展現狀進行分析,目的是進一步提高人臉識別精度。
關鍵詞:人臉識別;深度學習;深度算法;發展現狀
1 背景介紹
大數據時代信息冗雜,爆炸式增長的數據產生了信息泄露等嚴峻問題,保密機制形同虛設,信息時代面臨著前所未有的巨大挑戰。生物特征識別技術的出現恰好可以有效解決此問題,這項技術具有不易偽造和唯一性,可以稱之為“信息技術安全守護者”。人臉識別技術作為生物特征識別技術的核心技術之一,繼承了其唯一性的特點,而且包含人臉的光學表示。目前人臉識別技術被廣泛用于政府、軍隊、銀行、社會福利保障、電子商務、安全防務等領域[1]。
2?深度學習
深度學習(Deep Learning,DL)是機器學習領域中的一個研究方向,是一個復雜的機器學習算法,在語音和圖像識別方面取得的效果,遠遠超過先前的相關技術。它可以經過層間的輪班訓練和一般的微調迫使計算機進行自我學習,并且隨著網絡層的增加,學習能力逐漸被委托深入的學習理論,如對比度分集算法、背乘算法、時延神經網絡等專家混合系統,對于人工智能的發展具有重要意義[2-3]。
深度學習是學習樣本數據的內在規律和表示層次,這些學習過程中獲得的信息對諸如文字,圖像和聲音等數據的解釋有很大的幫助。隨著深度學習的發展,人臉識別技術更加成熟。
在人臉識別領域中,深度學習一共有以下幾種典型應用[4-5]:
(1)基于卷積神經網絡的人臉識別方法;
(2)深度非線性人臉形狀提取方法;
(3)基于深度學習的人臉姿態魯棒性建模;
(4)約束環境下的全自動人臉識別;
(5)基于深度學習的視頻監控下的人臉識別;
(6)基于深度學習的低分辨率人臉識別和其他基于深度學習的人臉相關信息的識別。
卷積神經網絡(Convolutional Neural Networks,CNN)是一類包含卷積計算且具有深度結構的前饋神經網絡,是深度學習的代表算法之一。基于卷積神經網絡的人臉識別方法,是深度監督學習下的機器學習模型,它可以挖掘數據的局部特征,并提取全局特征,然后進行分類,其權值共享結構網絡更類似于生物神經網絡,被應用于模式識別的各個領域。
2.1 ?深度學習概述及發展
深度學習是神經網絡的重要組成部分,有時也被稱為深度神經學習或深度神經網絡。
深度學習是由Hinton等人于2006年基于深度信網(DBN)提出的非監督貪心逐層訓練算法。隨著目標的正確識別逐漸成為人工智能的重要組成部分,基于深度學習的人臉識別目前也成了特征識別領域的研究熱點。
2.2 ?人臉識別細分類的深度學習算法
臉部表達模型分為二維臉部和三維臉部,即2D和3D臉部。二維人臉識別的研究時間比較長,方法流程也比較成熟,應用于許多領域,但由于二維人臉識別信息存在深度數據丟失的缺陷,無法完全表達真實的人臉,因此在實際應用中存在著識別準確率低、活體檢測率低等問題。
現在市場上的3D人臉識別根據使用相機成像原理主要分為:3D結構光、TOF、雙目立體視覺。
2.3 ?人臉識別算法
最近的幾年來,隨著相關領域人員對人臉識別的研究不斷深入,現有的人臉識別技術主要針對現實環境和現實應用場景進行識別,具體包括以下3個方面:
(1)人臉模型的設計,包括線性鑒別分析、線性建模方法、非線性建模方法和三維人臉識別[4]。
(2)新特征表征,包括局部描述和深入研究,部分說明和深度學習方法。
(3)新的數據源,包括視頻人臉識別以及草圖和近紅外圖像。
以下是較為經典的三大人臉識別的經典算法:
(1)Deep Face采用了一種基于監測點的人臉檢測方法。臉部檢測部分將首先選取6個基準點,2個眼心,1個鼻點,3個口點,然后利用SVR對LBP特征進行特征學習,獲得標記點。
(2)Face Net是谷歌提議的網絡結構,它可以靈活地使用22層 Zelier& Fergus的網絡,也可以使用 inception網絡,后者目前在物體識別方面比較有效。它的主要特點是利用3個單元之間的距離來構造損失函數。
(3)Center Loss不同于三元損失,中心損失并不直接優化距離,它保留了原來的分類模型,但是為每一類分別指定了一個分類中心。同一類圖像對應的特征都應盡可能接近其各自類別的中心,不同類別的中心應盡可能遠離。
3 人臉識別技術在深度學習中的廣泛應用
在不久的將來,全國主流的人臉識別技術將以識別13億人像為重點。可以預見的是,建立一個全國統一的人臉圖像數據庫,使存儲在這個數據庫中的數十億張人臉圖像的容量達到幾十億甚至幾千億張。此時,可以出現大量性能和關鍵功能相似的人臉。如果沒有基于深度學習的人臉識別技術,就沒有辦法建立更加復雜多樣的人臉模型,這就是為什么要實現準確快速的人臉識別會更加困難的原因。
4 未來的發展與問題
如今,基于深度學習的人臉識別技術已經取得了很大的階段性成功;而且有著非常廣闊和光明的前景和未來,它的發展空間非常的大,但隨之而來也會產生相關如下的幾個問題。
4.1 重心應該偏移至數據方面
基于深度學習的人臉識別技術的三要素—算法、硬件、數據,隨著相關科技的不斷發展和經濟水平的提高,算法與硬件的技術障礙越來越小,但是數據之間的差異則顯得越來越突出。對于人臉識別來說,把握數據入口,形成算法—產品—數據的閉環生態是算法在未來取勝的關鍵。與此同時,對海量數據的分析處理也將成為研究的重點。
4.2 發展終端和云端
目前,隨著 GPU和各種深度學習芯片等人臉識別技術的發展,使設備的運算能力得到了很大的提高,同時隨著手機、智能家居等設備的普及,前端和云端將更加智能化。
4.3 安全和隱私權
如今,數據正呈指數增長,數據安全和隱私問題也變得十分重要。而且臉部識別技術正好處在容易被不法分子利用的情況下,將面臨照片、視頻、面具等各種欺詐攻擊,臉部特征在傳輸、存儲過程中會受到黑客和其他犯罪嫌疑人的威脅,用戶在享受深度學習帶來的便利的同時,也非常關心自己的數據是否被盜用、傳播等。對活體探測、隱私加密等問題應加強研究,防止不法分子利用漏洞來侵犯用戶的權益以及隱私[6]。
4.4 兼容性
當前,隨著深度學習相關人臉識別技術的不斷發展,相關廠商也在不斷增加,但用戶往往需要根據自己的實際情況和需求來定制所需的人臉識別系統,但該系統所涉及的技術層面很多,從硬件到軟件,都需要各大廠商的支持,因此需要考慮從底層到上層的界面開發及兼容性問題,以推動其發展。
5 結語
伴隨著人工智能時代的不斷發展,深度學習在模式識別中的應用不斷深化,在網絡復雜性方面,深度學習網絡也需要簡化算法以提高其效率。因此在網絡功能方面,應探索深度學習與其他模式識別模型的結合,以不斷擴展網絡接口和功能。總之,深度學習將為包括人臉識別在內的模式識別應用打開新的局面。
[參考文獻]
[1]劉衛凱,郝雅倩,鄭晗,等.人臉識別綜述[J].信息記錄材料,2018(7):13-14.
[2]夏志強.人臉識別綜述[J].電子世界,2017(23):44.
[3]徐曉艷.人臉識別技術綜述[J].電子測試,2015(10):885-894.
[4]黨永成.人臉識別技術綜述及分析[J].電子技術與軟件工程,2018(3):158.
[5]金連文,鐘卓耀,楊釗,等.深度學習在手寫漢字識別中的應用綜述[J].自動化學報,2016(8):1125-1141.
[6]趙鵬,王斐,劉慧婷,等.基于深度學習的手繪草圖識別[J].工程科學與技術,2016(3):94-99.
(編輯 傅金睿)