朱東森,王 飛* ,白文娟,楊秉杰
(1.鄭州大學,河南 鄭州 450001;2.河南省高速公路聯網監控收費通信服務有限公司,河南 鄭州 450000;3.國家計算機網絡應急技術處理協調中心河南分中心,河南 鄭州 450000)
高等學校新生入學資格復查工作是“陽光高考”的重要組成部分,也是維護高等學校辦學秩序的一項重要工作,其關系到學生合法權益、教育的公平公正以及高等教育事業的有序發展。但以傳統的人工方式進行新生入學資格復查,不僅無法有效留存工作資料、難以進行監督和審查,并且無法保證工作質量[1]。
人臉圖像是人類重要的生物學特征,具有較高的區分度和不易被復制的良好特性,為身份鑒別提供了必要的前提[2]。基于該特性開發的人臉識別技術,相比于傳統人工識別方法來說,具有科學高效、穩定安全的特點,這為人臉識別技術應用于入學資格復查工作奠定了堅實的基礎。基于人臉識別技術開發的新生入學資格復查系統,采用Seetaface和Face++人臉識別算法構建識別引擎,將現場采集的人臉圖像與高考學籍照片進行對比,并根據對比情況向工作人員發出不同的提示,提高了工作的效率和質量。本系統由學生信息采集比對模塊和數據管理及統計模塊組成,具體結構如圖1所示。

圖1 高校新生入學資格復查系統結構
學生信息采集比對模塊實現系統數據從遠程服務器端到本地應用程序端的下載與學生信息數據的采集、識別比對、上傳等功能。學生采集數據的管理和統計模塊將采集到的數據進行分析處理,實現采集數據的統計以及系統的后臺管理、管理員權限分配、日志數據備份等操作。服務器與模塊間采用POST,JSON數據包進行加密通信。系統采用客戶端/服務器模式(C/S模式)進行開發,開發技術主要采用ASP.NET,整體框架使用MVC和Entity Framework,后臺數據庫通過SQL Server 2008來實現[3]。
系統具體工作流程如下:首先使用安裝有攝像頭的人臉識別終端機完成學生初始信息下載和現場人臉圖像的采集,在進行人臉定位和特征提取的基礎上,對現場采集圖像和初始圖像(高考學籍照片)進行識別比對,得到對比之后的相似度,對于相似度高于設定閾值的學生則認為是本人,對于相似度低于閾值的學生則發出警示信息,提示工作人員進行重點核對,最后將采集完成的數據以及檢測結果上傳服務器,便于后期統計和審查。
由于新生學籍注冊數據關系到個人隱私,因此系統必須采用必要的技術手段保障系統和數據的安全[2]。本系統從數據管理、數據通信和用戶登錄等方面對數據進行了保護。在數據管理方面,系統的本地配置文件和數據文件均采用MD5和DES加密技術進行加密,確保本地數據的安全;在數據通信方面,系統加入了唯一性標記,防止數據篡改,并且在Web端采用參數過濾技術以防SQL注入等攻擊;在用戶登錄方面,在采用MD5和DES加密技術對密碼進行加密的基礎上,系統外部還配有硬件防火墻,所有子系統都需要經過身份驗證才能正常登錄,并且所有的帳號均有嚴格的權限設置,從而保證了系統和數據的安全。
由于新生數量較多,本系統在實際應用過程中將會采集大量的學生學籍信息數據,為便于用戶直觀的查看數據信息和對數據進行查詢和分析,系統使用FastReport.Net插件和HighCharts插件將數據進行可視化處理。FastReport.Net是一款適用于Windows Forms,ASP.NET和MVC框架的功能齊全的報表分析解決方案。其優點在于通過內置腳本實現交互分析與數據處理和多數據源支持,并且具有豐富的報表元素,支持導入和導出RDL格式的圖表,方便報表的打印與輸出,具有資源占用少、速度快、擴展性強、可視化設計的優勢。Highcharts是一個用純JavaScript編寫的一個圖表庫,能夠很簡單便捷的在web網站或是web應用程序添加有交互性的圖表,由于使用JavaScript編寫,所以不需要像Flash和Java那樣需要插件才可以運行,而且運行速度快。HighCharts支持的圖表類型多樣,有曲線圖、區域圖、柱狀圖、餅狀圖、散狀點圖和綜合圖表。另外HighCharts還有很好的兼容性,能夠完美支持當前大多數瀏覽器。因此,本系統的學生采集數據統計和展示模塊采用這兩款插件來實現數據的可視化處理。
人臉識別的精確度是新生入學資格復查系統的核心指標,系統所構建的人臉識別引擎則直接影響到識別的精確度和穩定性。本系統基于Seetaface人臉識別算法和Face++人臉識別算法搭建了系統的人臉識別引擎。其中基于C++語言實現的SeetaFace人臉識別算法,具有較高的運算速度和效率,而在線識別的Face++人臉識別算法,能夠支持多種人臉姿態,并能應對復雜光照的情況,兩種算法均具有較高的識別準確度和可靠性。
綜合考慮系統的運算效率和在不同場景下識別的準確度,本系統搭建的人臉識別引擎對兩種算法按照公式k=ax+by進行加權計算,其中k值為最終系統給出的圖像相似度,x為SeetaFace人臉識別算法計算的相似度,y為Face++人臉識別算法計算的相似度,a和b分別為SeetaFace和Face++人臉識別算法的權值。該權值將根據系統測試情況進行動態調整。根據算法仿真計算發現,k值小于75代表兩張照片錯誤識別率為1/1 000,75~80代表錯誤識別率在1/10 000,照片相似度大于80代表錯誤識別率小于1/100 000。為確保資格復查的準確性,本系統設置當k值低于80時對工作人員提示加強核查。
基于人臉識別技術的高校新生入學資格復查系統開發完成后,針對某高校2017級不同專業的新生進行了抽樣測試,共計有1 639名學生參加了測試工作。根據本系統給出的置信區間進行衡量,參加檢測的1 639名學生當中有1 617名學生相似度高于80,可以認為是本人;有41名學生的相似度低于80,需要進行審查。經過排查,相似度低于80的41名學生當中,有32名學生是由于高考學籍照片模糊,無法進行識別;有9名學生是由于高考錄取后進行了微整形手術,造成現場采集照片和高考學籍照片產生差異,導致出現警示信息。此次測試結果表明系統各功能模塊運行正常,具有較好的識別準確度和可靠性。
基于人臉識別技術的新生入學資格復查系統的應用,是入學資格復查工作的一種創新,也是學生工作精細化管理的一次探索,能夠有效提升工作的質量和效率[1]。在下一階段的工作中,將基于本系統探索實現圖像采集工作與新生報到電子注冊工作相結合,即將電子注冊工作由錄入通知書條形碼轉變為人臉圖像采集和識別,進一步提高工作效率和效果,在高校新生入學工作中發揮更大的作用。