董勁波
易啟科技(吉林省)有限公司 吉林長春 130012
目前,面向視頻的動態人臉識別方法主要有3種思路。第一種思路是基于關鍵幀的傳統方法,它的原理比較簡單,是將動態人臉識別轉換成視頻人臉圖像關鍵幀的靜態人臉識別問題。但這種方法存在著一個問題,即關鍵幀的標準難以定義,缺少行業標準,難以被廣泛接受;第二種思路是基于圖像集方法,因為視頻數據是由圖像集組成,解決動態人臉識別可以轉換成圖像集的處理問題,主要的方法有利用超分辨技術、3D建模技術等。但此類思路的方法分別存在著對圖像集對齊較為敏感和計算負擔巨大的弊端;第三種思路是基于有序視頻序列的方法,利用視頻流中的時間信息和空間信息,但此類思路的傳統機器學習方法,如基于局部二值模式存在人工獲取有效的數據困難的弊端,且工作量巨大。本文的方法是基于上述第三種思路,結合深度學習的方法通過大量數據學習圖像特征的優勢,設計出一種同時回歸和分類循環網絡來跟蹤和識別人臉。實驗結果表明,本文方法在保證高準確率識別率的前提下,具有較好的魯棒性和實時性,能有效滿足實際應用需要。
在人工智能領域中,深度學習屬于重要的內容,其涵蓋內容眾多,具有跨領域、跨學科等特征,涉及數學、信息學、哲學、通信原理等多方面研究.深度學習可看成是利用計算機模擬人類學習的過程,從激勵響應、函數結果中對函數模型進行優化,在提供新變量數據的同時,按照模型對即將產生的激勵結果進行判斷.近年來,在互聯網和計算機技術飛速發展之下,深度學習也得到飛速發展,在語音識別、輔助判定等方面成果豐厚,同時在語音識別、視頻識別領域也獲得可喜成績[1]。
該技術屬于生物識別技術的一種,以人臉特征信息為依據,通過獲取靜態或動態的臉部信息,與事先預留的信息進行對比,由此得出識別者的信息,達到身份認證、人臉辨識的目標。
針對深度學習而言,其中的一個重要的學習和應用領域就算是對特定的事物的識別,這種識別技術是一種事先限定范圍的識別。例如針對人臉進行識別,就只能識別人臉這種客觀的圖像,對于其他事物則無能為力。這種識別的模式再賦予設備類似于人體的信息識別和處理功能的同時,可以不斷強化這種能力。結合特征提取技術,是實現深度學習識別的重要途徑,針對圖形和圖像的內容所包含的信息將其進行投射,實現信息的高維到低維的轉化,對于人臉的信息,可以將高維空間信息投射到低維空間中,幾何個特征的特征在低維空間子集中尋找相關性最大的特征點,這種識別的過程不涉及特征的屬性,只是進行單純的對比進行相關性的確定。結合線性判斷分析,實現對特定信息的類比識別。其過程為,首先借助類比內部的同類方差,進行相應的調整,放大類別間的方差。深度學習應用于人臉識別中主要借助的算法有最小化、最大化不同類間的方差。這些算法的使用極大地提升了人臉識別的精確度。同時為了更加高效的提取人臉的信息,借助于Gabor小波、局部LBP算法實現信息的獲取,并結合具體的應用場合,選擇多樣的算法進行圖像的識別。
該方法的核心思想是假設存在人臉圖像的區域是一個隨機變量,再采用K-L變換得到正交K-L基。其中特征值越大的基,包含的人臉信息越多。因此,PCA方法也被稱為特征臉方法。將多個包含人臉信息的特征基進行線性組合,便可完整的描述出人臉圖像特征,從而實現特征提取及降維處理。即PCA算法中人臉識別的過程是將人臉圖像數據映射到由特征基組成的子空間,并通過分類算法對不同特征的人臉分類,最終實現了人臉識別。
BP神經網絡的原理是先利用前向傳播計算網絡輸出,計算輸出部分的誤差。然后利用反向傳播算法向前估計輸出層與前一層的誤差,一直向前進行誤差的更迭。再根據層與層之間的誤差估計來不斷調整各層的連接權值,最后利用調整好的連接權值重新計算輸出誤差,直到輸出的誤差達到要求或者迭代次數達到提前設定的較大值為止。具體的BP神經網絡模型圖。神經網絡的學習規則就是通過不斷地反向傳播和修正權值、閾值,使誤差降低至最小。但不斷迭代的缺點是計算成本較高,若樣本數據維數過大[2],將會導致計算成本較大。因此,為解決維數導致的計算量過大問題,通常會采用降維的預處理方式,從而實現降低數據計算量以及去掉兀余數據的目的。
科技發展日新月異,人臉自動識別技術發展勢頭迅猛,成就非凡,但在實際場景應用中仍存在困難和部分安全隱患。人臉識別主要由兩種方法構成:①人臉比對,即判斷待驗證的人臉是否為本人。人臉比對非常簡單,有一張本人的照片即可輕松破解。②活體檢測,即判斷待驗證的人臉是否真實、有效。活體檢測環節原本是人臉識別的一大保障,但是破除方法也非常簡單,只需一個人帶上另一個人的頭像照片制成的立體面具便能通過,整個人臉識別也就名不副實,一個高科技支持的智能手段,變成了一個不安全的陷阱。人臉識別商業化程度越來越高,在金融、安防、社交等領域的應用日益廣泛,各大廠商現階段仍需對人臉識別有所提防,防止人工智能發展過快帶來安全隱患。因此,在應對隱私、支付等安全性需求較高的實際場景時,注意將多種生物識別技術相融合,這樣安全系數就會大幅提升[3]。
綜上所述,現階段,深度學習已經在圖像識別、視頻識別、語音識別等多個領域中得到廣泛應用,使以往受背景、光線等影響的弊端得到有效克服,提高人臉識別的精準度.在未來的發展中,應加強對該項技術的研究,使其在多種復雜條件下也可獲得理想的識別效果。