王 杰
(新鄉醫學院三全學院,河南 新鄉 453000)
隨著人工智能相關研究的廣泛應用及技術的快速發展,屬于人工智能架構中的技術應用層,處于人工智能發展階段中的感知智能階段的圖像識別技術同樣得到廣泛發展,其中的人臉識別區別與生物特征識別技術被廣泛應用于各個領域中。
生物特征識別是利用計算機技術,通過采集人類的生物特征樣本信息進行人物的身份信息識別,涉及的內容相對廣泛。其中,人的生物特征是人體各個器官部位的綜合體征,包括臉部特征、掌紋、動作、體形、虹膜、指紋、指靜脈、聲紋、步態等多種生物特征,其識別過程涉及圖像處理、機器學習、計算機視覺、語音識別等多項技術。
不同于指紋、掌紋、虹膜等其他生物特征識別,人臉識別技術具有直觀、非接觸性、方便采集、交互性強、可擴展性等優點,成為大數據背景下的生物特征識別中的典型研究領域。在計算機技術的支持下,生物特征被采集整理,并利用深度學習框架包含的算法得出個人獨有特征,以便于進行身份識別。
由于人臉面部的不同角度、表情以及環境條件,比如光線、角度、分辨率等外界環境因素,在識別率和誤差率兩方面容易受多維度因素影響,進而造成人臉識別的研究結果存在誤差。鑒于此情況,本文闡述了深度學習理論、卷積神經網絡、基于深度學習的人臉識別及深度學習在人臉圖像識別技術中的應用,分析了基于深度學習的深度卷積神經網絡的人臉識別技術應用技術路線,并對未來的應用發展進行展望。
深度學習是機器學習領域中一個新的研究方向,通過在多層神經網絡上運用機器學習算法對數據進行表征學習的方法,從而實現數據挖掘、計算機視覺、語音識別、自然語言處理等任務的算法集合。人工智能是使機器展現出人類的智力,機器學習是達到人工智能目標的一條路徑,而深度學習則是實現機器學習的一種技術。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。研究深度學習的動機在于建立模擬人腦進行分析學習的神經網絡,使其模仿人腦的機制來解釋數據,如圖像,聲音和文本等。
多層神經網絡的步驟是由特征映射到值,其中的特征是人工挑選得到的,而深度學習的步驟則是信號—特征—值,其中對應的特征是由網絡所選擇的。深度則體現在能對特征進行多次變換操作,深度的特有操作以及其在各領域的迅速發展,使得相關領域的研究學者在研究和應用中能夠從樣本中無監督地學習到更能體現數據的本來特征。
深度學習的核心是特征學習,是一個框架,其中包含多個重要的算法:卷積神經網絡(CNN)是一類包含卷積計算并且具有深度結構的前饋神經網絡(FNN)。隨著深度學習在理論知識和實踐應用領域的不斷深入研究并且迅速發展,相繼提出了多種卷積神經網絡模型,比如AlexNet、VGGNet、GoogleNet、ResNet等。以AlexNet模型為例,AlexNet的隱含層可以由5個卷積層、3個池化層和3個全連接層組成。人工智能機器學習中非常重要的一個算法——深度學習算法,而深度學習最擅長的能力之一就是分類圖像,目前深度學習算法對圖像的分類及對圖像進行識別的準確率相對較高。
為了有效地解決過擬合問題,對不同的位置區域提取出具有代表性的特征(進行聚合統計,如最大值、平均值等),這種聚合的操作稱為池化(Pooling),將輸入圖像縮小,減少圖像像素信息,只保留重要信息,但是特征的統計屬性仍可以描述圖像。由于降低了數據維度,可以有效地避免過擬合,而池化的過程一般被稱為特征映射的過程,即特征降維。
人臉識別是運用攝像機采集有關人臉的圖像或視頻,可以自動檢測和跟蹤人臉,并對檢測到的人臉進行自動識別。人臉識別具有采集方便、非接觸、并發及符合人的特點等特征,這也是其所體現的價值。基于深度學習建立的人臉識別技術主要包括兩方面內容,分別是人臉辨識和人臉檢驗,目標是使計算機和人一樣可以識別人,并且在某些方面更靈活、更便捷。
在人臉檢驗過程中的主要操作是判定是否存在人臉、圖像是否是人臉、人臉面部五官所在的位置等,即進行1對1的比對操作,對比當前所示圖像中的人物是否是同一人,其中檢測是否存在人臉時,需要將區域內人臉圖像裁剪出來;而人臉辨識則是判定區域內人臉圖像的身份,但前提是并不知道人臉圖像的身份,否則在識別可信度上存在片面性。因此人臉識別過程的操作是從大量人臉圖像中提取出指定的人臉,進行1對多的比對操作。基于深度學習的深度卷積神經網絡建立的人臉識別,必須構建數量大的圖像數據庫,存儲采集到的不同的圖像和人物身份信息,應用在各領域時可以提升識別圖像人臉信息和人物身份信息速度。
深度卷積神經網絡通過大量的數據訓練具有很好的自學習能力,不需要嚴格選擇特征,只需要引導學習來達到預期的目的,因此逐漸被廣泛地應用于圖像預處理領域。通過分析和研究現階段人臉識別技術在多個領域的應用研究成果,研究基于深度學習的人臉識別算法,算法流程主要包含組合特征構建和組合特征訓練兩部分。隨著基于深度學習的人臉識別算法的誤差率不斷降低,人臉識別技術被應用于金融行業、社保行業、教育行業、交通行業等各個與人類生活相關的方面,“刷臉”身份認證、“刷臉”支付、甚至“刷臉”進站等現象的出現,表明無論是在學術研究還是應用領域,人臉識別技術均有一定成果。
人臉圖像識別的應用已成為時下的熱點研究內容,而本文的主要研究內容就是分析深度學習在人臉圖像識別技術中的應用,因此本研究主要包含三個模塊:圖像識別、圖像處理以及深度學習模型訓練,技術路線圖如圖1所示。

圖1 技術路線圖
圖像識別利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術,是應用深度學習算法的一種實踐應用。首先通過圖像采集器、攝像頭及數據轉換卡等外部設備將光信號、模擬信號等物理信息轉化成數字圖像;其次進行圖像預處理操作,包括圖像去噪、增強、分割、重建等,具體的算法及相關技術主要包括灰度化、直方圖均衡化、形態學處理、各向異性擴散等;最后是圖像特征提取,而特征提取則是決定辨別結果的主要因素,其中常用的特征包括形狀、顏色及紋理等,目標圖像的重要特征是特征中的紋理,可以認為是顏色或灰度在空間分布的規律所形成的圖案。
現階段圖像識別技術一般分為人臉識別與商品識別,人臉識別主要運用在安全檢查、身份核驗與移動支付中;商品識別主要運用在商品流通過程中,特別是無人銷售貨架、智能零售柜等零售領域。
圖像處理即檢測和捕捉圖像、人臉圖像五官關鍵點的定位(用矩形框選中標注)、人臉特征提取操作。該模塊主要涉及光線、圖像等多方面的處理,包含光線補償、圖像灰度化、高斯平滑、圖像對比度增強等操作。圖像預處理模塊在整個應用中有相對關鍵的作用,圖像處理過程及結果質量的高低將影響實證驗證的可行性分析。
人臉圖像檢測以Adaboost算法為例,通過調整人臉圖像樣本所占權重和弱分類器的權值,從訓練出的弱分類器中篩選出權值系數最小的弱分類器并組合成一個最終強分類器。首先,分類正確率高的學習器權重較高,分類正確率低的學習器權重較低;其次,對圖像進行歸一化、去噪等圖像處理操作,提取圖像特征,構建DCNN模型;最后將以上圖像信息進行人臉圖像信息管理操作,即建立數據庫管理系統并將圖像信息進行存儲。
深度學習模型訓練選擇精確度相對較高的模型,設置對應的優化算法及參數進行訓練得到可用的模型,需要大量的實驗并根據結果不斷對模型的參數進行調整,為提高人臉圖像識別的精確度和提升識別效率起到關鍵性的作用。在隱私安全方面,隨著深度學習及其模型和算法在人臉識別中的應用,人臉識別技術應用覆蓋領域逐漸廣泛,造成隱私安全問題,各類終端設備采集的人臉圖像數據的存儲、利益驅使收集人臉圖像等問題,同樣是需要關注的熱點。因此,相關領域的研究學者針對隱私保護提出了方法,避免技術被濫用。
隨著深度學習的不斷發展,算法和模型的廣泛應用,人臉識別技術的應用已成為時下的研究熱點。目前,在解決各類復雜因素下的人臉識別問題時,傳統的人臉識別技術,實際應用面臨很多方面的挑戰。隨著深度學習的發展和廣泛應用,人臉識別研究有了相對較大的成果,構建深度學習的各類算法或模型,結合其特點,在自適應性、精準性以及速度等多方面得到很大提升。總體而言,結合深度卷積神經網絡模型,運用人臉識別技術,完成人臉圖像的有效辨別,最后實現識別功能,有效提高識別準確度、人臉識別率,從而為各應用領域提供科學而準確的量化依據。
基于深度學習—DCNN的人臉識別技術的不斷發展,在圖像樣本數量增加的情況下,為了更好地解決問題,國家相關法律法規也在不斷完善,技術的合理化應用,如安防人臉辨識和檢驗、各類場所的實時監控等領域對人臉識別技術的精確性要求更高,人臉圖像在面部表情、姿勢、光照、遮擋等外界環境下改進算法,降低人臉圖像識別的誤差率,進一步提高人臉識別的效率。大數據時代,為了適應當前的發展,對數據庫資源要求也相應提高,因此將面臨相對較大的挑戰性,而基于深度學習的人臉識別技術與其他技術結合使用,可更好推動人工智能在各個領域應用的發展。