吳悠
摘要:高效、準確的身份識別技術可方便大眾進行社會活動,提升人民群眾的安全感與生活滿意度。通過分析研究基于身份證件信息的人臉識別技術,分別闡述了居民身份證閱讀機具的工作原理,當前主要的人臉識別方法及其優缺點,基于二代證機讀信息的人臉識別系統,并指出了當前人臉識別的難點及未來研究方向。
關鍵詞:居民身份證閱讀機具;二代證;人臉識別
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2018)04-0048-03
隨著時代的發展,科技的進步,準確、快速的身份識別與認證技術被廣泛應用于火車站、機場、港口、銀行、大型活動等重要場合。由于傳統的身份識別:身份證、門禁卡、二維碼、用戶名和密碼、駕駛執照等證件,具有易偽造、易遺忘、易盜用等較大的局限性,越來越難滿足社會的需求,開發尋找一種新型高效的身份識別技術的重要性已不言而喻。生物特征識別方法所依據的是個體特征的獨特性,當某類特征同時具備普遍性、可測性、可接受性、安全性、唯一性、持久性和識別性能七個方面的要求時便適宜作為人的身份識別。在眾多的身體特征:指紋、掌形、視網膜、虹膜、人體氣味、臉型、皮膚毛孔、手的血管紋理和DNA等;行為特征:簽名、語音、行走的步態、擊打鍵盤的力度等特征中,人臉識別因其具有易獲取、穩定性高、直觀性好、方便、自然、友好、信息量大、更易被人接受等優點,已成為當今火熱的生物特征識別技術研究領域之一[1]。將傳統的身份識別技術與人臉識別相結合進行身份識別可提高身份驗證的安全性與可靠性。本文主要介紹了二代證閱讀機具的工作原理、人臉識別系統及二者的組合應用。
1 居民身份證閱讀機具工作原理
第二代居民身份證(以下簡稱二代證)內置集成電路芯片,本身不具磁性,不會被磁場改變結構而消磁。居民身份證閱讀機具(以下簡稱閱讀機具)的工作原理是依靠閱讀機具的天線向居民身份證輻射13.56 Mhz的電磁波,激活二代證芯片,通過配置給二代證專用閱讀機具的安全控制模塊(SAM)與二代證進行雙向認證、讀取并解密所存儲的個人身份信息,進行信息交換。閱讀機具的組成框圖如圖1所示[2]。
1.1 控制單元
控制單元是閱讀機具的“大腦”,主要由CPU及外圍電路組成,并與上位機軟件建立通訊,執行其發來的各項命令。
1.2 安全控制模塊
閱讀機具內置有門衛式二代證安全控制模塊,在核驗證件時,安全控制模塊與二代證進行雙向認證、讀取并解密二代證內存儲的個人身份信息。因二代證內的信息被分區存儲,由密碼技術實現訪問控制,因此驗證系統亦需不同的安全控制模塊,以分別控制讀取基本信息區和指紋信息區的信息。
1.3 射頻電路
射頻電路是讀取二代證信息的一個中間環節,主要流程如下:
(1)產生13.56 Mhz的發射信號,激活二代證并為其提供能量;
(2)對發射信號進行調制并將其傳送給二代證;
(3)接收并解調來自二代證的反饋信號。
1.4 天線
天線是閱讀機具與二代證進行信息交換的中間橋梁,由線圈、電容等組成的并聯諧振回路。一是為二代證提供足夠的能量和準確的操作指令,并接收二代證的響應信號,二是與放大電路匹配并確保其高效穩定的工作[3]。
2 人臉識別系統
人臉識別技術是生物識別技術的代表之一,即通過計算機進行人臉特征提取并進行身份驗證的一種技術[4],具有操作簡單、可跟蹤性強、隱蔽性好、準確可靠、直觀等優點。人臉識別技術亦是當今研究火熱的人工智能領域的一個重要分支,涉及計算機視覺、模式識別、圖像處理、生理學、心理學等眾多學科的理論與方法,是一項極具挑戰性的研究領域。
2.1 技術流程
人臉識別技術主要包括以下四個過程。
(1)圖像采集與檢測。
圖像采集:采用攝像頭等設備進行圖像采集或視頻圖像捕捉,是實現人臉識別的前提。
人臉檢測:利用高效的算法對采集到的圖像進行特征檢測,找到人臉所在的位置,并計算其占圖像面積的比重,為預處理做準備。
(2)圖像預處理。對檢測到人臉的圖像進行預處理,包括光線補償、灰度變換、尺寸歸一化、噪聲過濾、幾何校正等。
(3)特征提取。采用基于知識的、代數特征或統計學習的方法獲取人臉的特征數據,特征提取是人臉識別技術的核心步驟,提取質量的好壞將直接影響到識別的精度。
(4)人臉比對。比對模式可分一對一和一對多,一對一的典型模式即驗證圖像中的特征與二代證中的證件照是否匹配;一對多即將圖像中的人臉特征與數據庫中的特征模板進行比對,并輸出其相似程度的過程。
2.2 主要識別方法[5]
2.2.1 基于幾何特征的方法
每個人的五官各不相同,具有不同的形狀、大小及相對位置,通過對這些特征的提取比對即可識別出圖片中的人臉,基于幾何特征的識別算法被認為是最具歷史的人臉識別算法,雖然直觀、簡單、受光照的影響比較小,但其魯棒性較差,易受表情變化、特征點被遮擋等因素的影響,導致識別率嚴重降低。
2.2.2 基于主成分分析(PCA)的方法
PCA的實質是一種基于K-L正交變換的識別算法。特征臉識別即采用PCA進行降維,將原始圖像投影到特征空間,并將獲得的權值向量與庫中的權值向量進行比對,以此判定人物身份的過程。特征臉識別方法具有簡單、識別速度快等優點,是較流行的識別算法之一;對訓練集與測試集的相關性要求較高,易受光照強度、拍攝角度、面部表情等因素的影響。
在PCA的基礎之上,研究者們又提出基于“投影后類內方差最小,類間方差最大”思想的線性判別分析(LDA),當訓練樣本數量足夠多的情況下其性能明顯優于PCA;基于“通過線性變換得到相互獨立的一組基來描述樣本數據”的獨立成分分析(ICA),較PCA的計算更加復雜。
2.2.3 基于模板匹配的方法[4]
模板匹配是一種最基本、最簡單的模式分類方法,通過利用某一圖案在圖像中的位置進行識別的過程,可分為靜態匹配與彈性匹配兩種。
(1)靜態匹配。靜態匹配即事先設計出一個人臉庫,將待識別的圖像與庫內模板進行相同的變換:尺度歸一、灰度處理,得到大小、光照和取向均相同的圖像,進而進行匹配識別的過程。存在靈活性差的問題。
(2)彈性匹配。針對靜態匹配的不足,特提出了靈活性與魯棒性更強的彈性匹配。它是基于動態鏈接結構的一種算法,首先匹配待檢測人臉最相似的模型圖,再對相應的節點位置進行匹配,并最終生成變形圖的過程。存在對參數的初值依賴度高、圖片存儲量大、計算量大的不足。
2.2.4 基于貝葉斯(Bayes)的方法
基于貝葉斯方法的前提是假設樣本空間均滿足高斯分布[6],針對不完整的樣本進行概率估算,并利用貝葉斯公式對其進行相應的修正,最終依據相似程度進行圖像識別的過程。研究表明,采用Gabor特征分類器較采用圖像灰度特征分類器有更好的識別效果[7-8]。
2.2.5 基于支持向量機(SVM)的方法[7]
支持向量機是一種基于結構風險最小化原理的統計學習理論,主要解決二分類問題,將低維數據映射到高維空間,并在高維空間給出最優的分類界限,將兩種數據最大間隔分開。因為采用核函數進行操作,所以具有較好的學習能力和泛化能力。該方法對小樣本空間的訓練與識別效果表現良好,但在訓練樣本時消耗的存儲空間較大。
因SVM主要解決二分類的問題,因此在實際應用中需要采用以下兩種策略進行應對:一是one-against-all策略,即將所有目標僅分為這一類和非這一類兩種;二是one-against-one策略,即將所有目標分類轉化成N個二分類的問題。
2.2.6 基于AdaBoost的方法[9]
AdaBoost是改進后的Boosting算法,由Viola等人提出,是以迭代的形式,將針對同一個訓練集訓練出的弱分類器進行N次疊加,最終形成強分類器的過程。依據每次分類結果的準確率對每個樣本的權值微調,并進行再次訓練,最終將所有分類器進行融合形成決策分類器。在一定程度上可減少計算量,提高檢測速度。
2.2.7 基于隱馬爾可夫模型(HMV)的人臉識別[4]
人臉識別中主要是對人臉的整體進行描述,不僅包括五官的特征,亦包括它們之間的相互聯系,隱馬爾可夫模型是解決這類問題的典型代表,由Samaria提出并應用于人臉識別中。用一組特征數值將人臉圖像分為額頭、眼睛、鼻子、嘴巴和下巴五個主要特征區域,然后用矩形窗口從上到下進行采樣,利用采樣區域的像素值來進行人臉識別。
隱馬爾可夫模型具有較好的魯棒性,允許有適當表情變化和頭部扭動,對其變化不太敏感,但該方法在使用過程中需要較大的運算量,實現難度較大。
2.2.8 基于人工神經網絡(ANN)的方法[4]
人工神經網絡是通過模仿生物神經網絡行為特征而形成的一種運算模型,通過內部節點的相互作用進行信息處理。基于神經網絡的人臉識別方法即利用神經網絡所具有的學習能力與分類能力,利用其對經典模型的學習與訓練,進而對人臉特征進行提取與識別的過程。流行的神經網絡有:卷積神經網絡、BP神經網絡、基于小波的神經網絡、基于概率決策的神經網絡等。
神經網絡具有強大的學習能力,可通過對模型的反復學習提高識別隱含信息的能力,進而提高人臉識別的準確性,具有較好的魯棒性與適應性。亦存在處理數據龐大、訓練過程較慢的問題。
2.2.9 基于三維人臉的方法
二維人臉識別實質是將三維人臉進行平面投影的結果,勢必會丟失一些特征,且易受光照、表情、姿態、遮擋物等因素的影響,嚴重降低了識別的精度。研究學者遂提出了具有信息含量大、抗干擾能力強的三維人臉識別技術,可大大的提高識別的準確率。依據識別系統所采用特征的不同形式,可將其分為基于整體特征信息、基于局部特征信息、基于雙模態信息和基于特征信息融合的四大類三維特征人臉識別系統。
2.2.10 基于紅外熱成像(TIS)與近紅外(NIR)的方法[10]
紅外熱成像識別是一種依據人臉皮膚組織的紅外輻射所形成的紅外圖像進行人臉識別的技術。與基于可見光的人臉識別相比,具有受光照、表情、膚色、姿態等因素影響小的優點,但紅外人臉圖像的細節和邊緣輪廓較模糊,對玻璃的敏感性高,易受環境溫度影響。
近紅外識別的圖像中僅有灰度信息,可保留更多的信息特征,更利于提高人臉識別的精度,且具有受光照、姿態、表情變化影響小,易穿透玻璃等材料,可輕松獲得被眼鏡遮擋的人臉信息。
3 基于二代證機讀信息的人臉識別(圖3)
在基于身份證件信息的人臉識別系統中的典型應用是人證比對儀,通過讀取二代證機讀信息的同時進行圖像采集,將采集到的人臉信息與閱讀機具讀取的證件照進行一對一實時比對,并報告二者的匹配程度,并可通過設定相應的閾值,提示告知可能存在人證不一致的情況。主要應用于關卡、大型會議等重要場合的人證一致性核查。
4 結語
閱讀機具與人臉識別系統進行有機結合,不僅可解決僅識別二代證的單一問題,而且可有效進行人證一致性的比對識別,大大提高身份識別準確性,降低工作人員的勞動強度、減少識別失誤率。
但是,人臉識別技術仍處于發展階段,存在人臉相似性、變異性、光照影響、姿態變化、年齡偏差、有效的訓練樣本不足等技術問題。且主要通過增大對復雜場景數據庫的學習來提高識別準確度,并非數據規模越大越好,相反易造成計算復雜度增加、運算緩慢、過擬合等問題,目前還沒有一個算法可完全徹底地解決上述問題。
隨著深度學習模型、異質人臉識別、運動檢測算法、活體檢測技術、多種人臉識別算法融合的方法、全自動人臉識別等模型、方法與技術的不斷提出與深入研究,基于身份證件信息的人臉識別必將更加準確、高效。
參考文獻
[1]楊吉祥.二維及三維人臉識別方法研究[D].重慶大學,2013.
[2]吳思雄,張斌,屠黎娜.二代身份證閱讀機具設計及EMI措施[J].環境技術,2016,34(04):34-37.
[3]陳龍.第二代身份證讀卡模塊開發及應用[D].蘇州大學,2007.
[4]董琳,趙懷勛.人臉識別技術的研究現狀與展望[J].安防科技,2011,(10):22-26.
[5]施為.公安系統人臉識別算法的研究與實現[D].南京郵電大學,2013.
[6]曾岳.人臉識別方法的研究[D].西安電子科技大學,2011.
[7]馬寧.基于圖像的人臉識別中關鍵技術研究[D].吉林大學,2016.
[8]左騰.人臉識別技術綜述[J].軟件導刊,2017,16(02):182-185.
[9]郭慶.基于視頻監控的人臉識別研究[D].安徽大學,2014.
[10]曾夢璐.近紅外人臉識別算法研究[D].陜西師范大學,2013.