謝奕樊 山東師范大學附屬中學(幸福柳)
19世紀80年代末,在《Nature》上Galton第一次系統介紹了人臉識別,是已知的最早的關于人臉識別的文章。然而,人臉識別技術經過100多年的發展,在20世紀80年代后進入才初級應用階段。隨后,特別是近十幾年,人臉識別技術進入蓬勃發展期,目前在身份識別、門禁、偵查等方面有著廣泛而重要的應用。

圖1 Web of science人臉識別每年發表文章
在Web of science上,對人臉識別進行文獻檢索,檢索結果如圖1所示,可以看到計算機領域人臉識別每年發表的文章數目逐年遞增,有越來越多的人進行相關研究,是研究的熱門領域。

圖2 據根據IBG發布的全球生物識別市場規模推算資料(IBG前瞻產業研究院整理)
人臉識別的市場:根據公開文獻資料,2009-2016年全球人臉識別行業市場規模發展趨勢(單位:百萬美元) 如圖2所示,可以看到人臉識別市場份額由2009年390億增長到2016年2653億,增長為原來6倍之多,市場份額越來愈大,具有很大的應用前景。
圖3是人臉的識別的過程,包含圖像獲取,預處理,特征提取,分類識別等四步。

圖3 人臉識別的過程
此類方法,將一張臉像表達為一個像素矩陣,這個矩陣通常被轉換成像素矢量。盡管這些方法很容易實現,但是它們對變化(姿勢、燈光、面部表情和方向)很敏感,影響識別的準確率。將該類技術可以進一步劃分為線性和非線性的技術。
3.1.1 線性技術
這些方法將輸入的一個大空間圖像數據線性投影到一個區域相對較小的空間(子空間)。然而,該方法對臉部/非臉部形態進行分類時,并不是很有效。
特征臉算法:這是一種非常流行的面部識別方法,是基于PCA的技術(主成分分析)。給定一組樣本圖像,本質上是找到這些面孔的主要組成部分,確定協方差矩陣的特征向量,然后將其描述為特征向量的線性組合。
2D PCA:為了避免將圖像轉換為向量時丟失信息,二維PCA接受的是輸入圖像而不是矢量。
獨立元分析法(ICA):這是一種主要用于信號處理的方法。
多維標度法(MDS):該方法在投影中并不保存數據的方差,而是保存所有數據之間的距離,進而通過特征值分解尋找一個最小化的線性變換。
非負矩陣分解法(NMF):非負矩陣分解是一種不使用類概念表示面的方法。NMF在基向量組合權重中不允許包含負元素。
線性判別分析法(LDA):LDA,也叫做“Fisher線性判別”,是最廣泛使用的人臉識別方法之一。包括兩步:PCA減小原始空間和得到最終投影空間的向量。
獨立高強Gabor小波法:從正面圖像的Gabor小波變換中提取出高強度特征向量以提高人臉識別精度。Gabor小波被認為是最好的人臉識別方法之一。
3.1.2 非線性技術
當輸入數據結構是線性時,線性方法可以得到數據稀疏的真實表達。然而,當數據是非線性的,需使用核函數的來構建一個大的空間,在這個空間中,將問題變成線性的。在此背景下,提出了幾種非線性方法:
核主成分分析(KPCA):KPCA是使用核函數對經典的線性技術PCA進行非線性重構。由于KPCA技術是基于“內核”的,內核矩陣的大小與樣本數量的平方成正比,因此訓練樣本困難。
支持向量機(SVM):該方法在不需要更多知識的情況下,具有高泛化性能識別的學習技術,可以更好地減少圖像的大小。然而,盡管該方法經常在某些特定的測試中提高識別率,但是卻無法像線性方法一樣保持足夠的可靠性。
該方法首先提取特定的幾何特征,比如頭部的寬度,眼睛之間的距離等等。然后,這些數據將成為“分類器”識別個體的入口。
彈性圖匹配法(EBGM):這是DLA方法的擴展,其圖像節點位于臉部的一些選定點上。
幾何特征向量法:該技術使用訓練集來檢測眼睛的位置,首先計算待測圖像和訓練集之間的相關系數,然后搜索得到最大值。
人臉統計模型法:該方法使用許多特定檢測器去檢測人臉各部分特征,如眼睛,鼻子,嘴巴等。
該類技術,在局部區域定義好后,對于人臉識別系統的性能是至關重要的就是找到代表該區域信息的最佳方式。常用的方法有:Gabor系數法,哈兒小波法,傅里葉變換法,尺度不變特征變換法(SIFT),局部二值模式法(LBP),局部相位量化法(LPQ),韋伯定律描述符(WLD)等。
與全局方法相比,局部方法具有一定的優勢。一是可以提供基于局部區域的附加信息,二是對于每種類型的局部特征,可以選擇最合適的分類器。
該方法同時使用全局和局部統計以結合二者的優勢。
隱馬爾可夫模型(HMM):在人臉識別中,該方法對于重要的面部區域(頭發、前額、眉毛、眼睛、鼻子、嘴和下巴),會從上到下排列成自然的順序。
基于偽隱馬爾可夫模型的Gabor變換(GWT-PHMM):該方法可以結合Gabor小波變換(GWT)的多分辨率能力和偽隱藏馬爾科夫模型的局部交互二者的優勢。
在HMM使用PCA和離散余弦變換(DCT)的識別系統:不使用DCT,直接使用PCA降低維度。
HMM-LBP:這是一種被稱為HMM-LBP的混合方法,允許通過使用LBP工具對人臉圖像進行來進行特征提取。
此外,還有GARG(高斯分布黎曼流形判別分析),HMMSVM-SVD,SIFT-2D-PCA,小波變換和定向LBP等方法可以實現人臉識別。
盡管在人臉識別領域取得了很高的成功率,但仍然存在兩個主要的未解決的問題,即照明和姿勢的變化。為了克服這兩個問題,提供更精確的面部形狀信息,出現了更多新技術,例如3D人臉識別,深層神經網絡(DNNs),紅外(IR)成像等都取得了重大成功。在未來,人臉識別的難點,諸如數據采集免干擾、遠距離識別、3D細節構建、環境設別光照、多姿態人臉識別、表情變化、人的老化、飾物或者遮擋、膚色變化等也必然被進一步克服。