高浚哲
(徐州市第一中學合作民辦校,江蘇徐州,221000)
人臉識別技術值得是通過比較人臉的視覺特征信息從而進行身份鑒別的技術[1],是生物特征識別的典型代表。人臉識別技術從廣義上而言,還包括了人臉檢測、人臉跟蹤、人臉比對等一系列相關技術。
人臉識別具有非強制性、非接觸性的特點,可以在用戶無意識的狀態下直接獲取人臉圖像,不需要用戶專門配合人臉采集設備,也不需要如采集指紋般需要用戶和設備直接接觸以獲取人臉圖像。除此之外,人臉識別還具有操作簡單、結果直觀、隱蔽性好等特點。總而言之,相對于其他生物特征識別技術,人臉識別技術具有普遍性更高、可采集性更高、可接受性更高的優點。近幾年來,人臉識別技術成為計算機視覺領域的一大熱點。
人臉識別技術良好的特性使得人臉識別引起了越來越多研究者的重視,有人將人臉識別技術稱為“早上八九點鐘的太陽”,足以說明人臉識別技術的巨大發展潛力。人臉識別技術在金融、公安及其他需要安全認證的行業和部門大放異彩,也被廣泛應用于人員考勤、電子商務、身份鑒定、信息安全等領域。目前,我國從事人臉識別技術研究的單位有很多,使得生物特征識別技術形成了一定市場規模。2008年,以清華大學和中科院自動化研究所為代表研發的北京奧運會實名制票證系統將人臉識別技術推向新的高潮,為人臉識別技術的應用打下了堅實的基礎[2]。2012年4月13日京滬高鐵安檢區域人臉識別系統工程開始招標,上海虹橋站、天津西站和濟南西站三個車站安檢區域將安裝用于身份識別的高科技安檢系統—人臉識別系統,以協助公安部門抓捕在逃案犯,為人臉識別技術在犯罪調查的領域添加了濃墨重彩的一筆。
由于反恐、國土安全和社會安全的需要,世界上各個國家都對安防領域加大了投入,其中人臉識別技術正是安防的一個核心領域[3]。在十幾年的發展中,人臉識別技術已經成為全球性的生物識別共識之一,相關的研究已經取得很大的進展。生物識別技術的熱潮,也為人臉識別技術帶來更加廣闊的發展前景。
傳統的簽到方式不外乎紙質簽到、點名簽到及刷卡簽到的方式。
紙質簽到方式需要提前打印相關信息,不僅浪費紙張,而且在簽到過程中費時費力;點名簽到方式在用戶較少的情況下相對可行性高,但是當用戶人員劇增,比如大學校園中課堂人數可能過百,一一進行點名的方法明顯不可取;刷卡簽到的方式改善了紙質簽到與點名簽到的很多弊端,但是也存在其不足,其中最明顯的一點就是為了簽到,每個人必須攜帶相關的身份卡,一旦該卡遺失,就會造成很多不必要的麻煩。
與上述幾種傳統的簽到方式相比,本系統采用全自動簽到的模式。用戶只需走過面部采集的攝像頭,就能實現簽到,更加高效便捷,也更人性化。

圖1 系統示意圖
在采用本系統實現簽到功能之前首先需要采集用戶的基本信息與人臉信息,并保存到相應的數據庫中;在系統運行過程中,必須借助一些硬件進行針對人臉圖像的收集,將獲得的當前數據與數據庫數據進行對比分析,從而得到簽到結果。因此,從整體上而言,我們將本系統大致分為三個部分,并分別命名為硬件部分、數據庫部分及識別部分。

圖2 用戶信息
硬件部分主要包含兩個設備:攝像頭和顯示屏。
攝像頭主要用于采集用戶的頭像信息,是人臉檢測與識別過程的基礎。為了提高檢測的準確性,我們要求攝像頭能夠拍攝高清的圖像信息。在信息錄入與識別的過程中,均需要用到攝像頭。
顯示屏主要用于輸出當前的簽到結果,在我們的設計中只實現簡單的文字輸出。如顯示“張三簽到成功”、“未檢測到人臉”、“無法識別此人”等,給出相關的提示信息,從而判斷當前用戶是否簽到成功。
對于本系統而言,需要建立一個存放用戶數據的數據庫。在系統用于識別之前,采集需要進行簽到的全體用戶信息。用戶信息主要包含三個部分的內容,即身份信息、圖像信息和簽到信息,便于系統對這些數據進行處理和調用。身份信息代表的是用戶的基本身份數據,包括身份證號、性別、住址等;圖像信息則代表用戶的人臉圖像數據,包括人臉樣本信息、人臉樣本圖像特征信息等;簽到信息代表用戶的簽到情況,包括簽到時間、簽到地點等。這些用戶信息結合在一起,形成一個完整的用戶實體。
本系統主要采用E-R模型法設計數據庫。以用戶為實體,其E-R圖大致如圖3所示。

圖 3 用戶 E—R 圖示意
針對不同的應用環境,實體屬性可以進行相應的增刪。比如說,如果該系統應用于校園中,以學生為用戶,則其屬性可以添加學號、導師姓名等,其主碼也可進行靈活調整。
識別部分是系統的核心,是實現人臉檢測與識別的軟件部分。
對于系統的識別過程,描述如下:當用戶進入到攝像頭采集信息的范圍后,攝像頭會自動拍攝圖像;對于獲得的圖像信息,首先進行人臉檢測,判斷圖像中是否存在人臉,若存在,系統才能繼續進行下一步工作;當檢測到人臉后,計算機自動比對所得人臉與數據庫中的用戶圖像信息,當該用戶存在于數據庫中時,即可根據其相應的身份信息得知用戶身份,從而實現簽到。
必須說明的是,人臉檢測與人臉識別存在一定的區別。人臉檢測指的是判斷當前獲取的圖像中是否確實含有人臉部分,并將人臉圖像信息從背景中提取出來;人臉識別則需要比對已經提取的人臉信息,與數據庫進行比對分析,判斷該人臉代表的身份信息。可以說,人臉檢測是人臉識別過程的前提與基礎,人臉識別過程則是人臉檢測的目標與結果。

圖4 簽到過程流程圖
人臉識別技術發展至今,已經產生了各種各樣的方法,如基于子空間分析的人臉識別、基于隱馬爾可夫模型的人臉識別、基于神經網絡的人臉識別等[4]。本系統主要采用的是基于模式識別的人臉識別技術。所謂模式。就是把通過對具體的個別事物進行觀測所得到的具有時間和空間分布的信息[5]。簡單來說,當人類能夠一眼認出一個蘋果,是因為在日常生活中,我們的思維被不斷訓練,從而提煉出關于“蘋果”的樣本信息,如大小、形狀、顏色等。這一樣本就是蘋果的模式。當再一次看到蘋果時,人腦會自動進行模式匹配,最終得出當前物體是否為蘋果的結論。這與“物以類聚”的說法有一定的相似之處。
在模式識別系統中,通過大量樣本訓練,主要獲得人臉模式,將這些模式存儲在數據庫中,為本系統的人臉檢測與識別提供便利。
受到廣泛肯定的模式識別系統分為數據采集、數據預處理、特征提取和分類決策四個部分[4]。如圖5所示。

圖5 模式識別系統
獲取的數據要求是用計算機可以運算的符號來表示所研究的對象。我們將一幅圖像進行數字化后進行存儲分析。圖像數字化的過程就是在計算機內生成一個二維矩陣的過程。舉例如圖6所示。

圖6 圖像量化實例
本系統的數據主要是通過高清攝像頭采集的人臉圖像信息。注意這些人臉圖像僅僅用作獲取樣本數據,可以不是最終數據庫中存儲的用戶。
圖像的預處理主要指圖像去噪的過程。在圖像信息中,各種阻礙信息獲取的因素稱之為噪聲。去噪的目的就是為了排除不相干信息的干擾,如衣領、背景、光線等,只留下與人臉信息相關的內容,如人臉的長寬比例、膚色等。
特征提取的過程就是對原始數據進行變換,得到最能反映分類本質的特征。簡單的說,特征提取即在當前獲得的數據中尋找對結果影響最大的有效信息。特征提取在模式識別過程中是關鍵的一步。特征的選取十分慎重,其數量并不是越多越好。
分類決策的過程就是在特征空間中用模式識別方法把識別對象進行歸類。基本的做法是在樣本訓練集基礎上確定某個決策,使得按這種規則對被識別對象進行分類所造成的誤差或損失最小。
簡而言之,在本系統中,假設最終通過臉型對樣本進行分類,就需要通過給定計算的方法,使得最終結果能將圓臉、鵝蛋臉、瓜子臉等臉型進行有效分類。
本系統摒棄了傳統冗長費力的簽到方式,采用基于模式識別的人臉識別技術,使得簽到過程不再成為用戶的負擔。隨著研究的深入,我們也意識到人臉識別技術存在一定的難題,比如人臉的姿態、光照、表情[3]等的變化都會對識別的準確度造成影響。隨著技術的逐步完善,人臉識別技術還有很大的發展空間。相信在人臉識別技術的下一階段發展過程中,會誕生更多諸如簽到系統的實用性應用,為人們的生活帶來更多便利。
* [1]徐曉艷.人臉識別技術綜述[J].電子測試,2015,(10):30—35+45.
* [2]賈川.淺談人臉識別技術應用及發展趨勢[J].中國安防 ,2010,(03):83—86.
* [3]董琳,趙懷勛.人臉識別技術的研究現狀與展望[J].安防科技 ,2011,(10):22—26.
* [4]薛冰,郭曉松,蒲鵬程.人臉識別技術綜述[J].四川兵工學報 ,2010,(07):119—121+130.
* [5]范會敏,王浩.模式識別方法概述[J].電子設計工程 ,2012,(19):48—51.