李佩蓉解 解崔 旭李姍姍
(1.西北大學公共管理學院 陜西西安 710127)(2.西北大學信息與科學技術學院 陜西西安 710127)
隨著新一代信息技術的迅速發展,智慧圖書館開始成為圖書館界持續關注和研究的熱點之一[1]。智慧圖書館是圖書館在新技術革命影響下的一次創新性的轉型,它借助物聯網、大數據、云計算、人工智能、虛擬現實等新技術實現了圖書館的物理空間智能化、信息資源(知識)組織智能化、服務方式智能化以及管理手段智能化等,推動圖書館升級換代,力求為用戶提供更高效優質的服務、構建更具吸引力的信息互聯環境、打造更多元化的信息共享空間。目前,智慧圖書館在實現服務管理的智能化上主要借助于物聯網技術、RFID 技術、24小時自助借還系統、手機/網絡自助續借系統、智能清點/定位系統、智能座位預約系統、3D/AR/VR導航系統等[2]。值得注意的是,人工智能中的人臉識別技術作為服務方式智能化的實現途徑之一,尚未廣泛地應用于圖書館中。
人工智能是讓計算機擁有分析、感知等能力,模擬人類思考過程并作出反應的技術。人工智能的研究方向包括機器人、語言識別、圖像識別、自然語言處理和專家系統等[3],近兩年人臉識別是人工智能學科發展中最為快速的一個分支[4],已有很多成功應用,比如火車站、機場刷臉驗票、Face++技術為支付寶提供的刷臉登錄、百度機器人等[5]。在大多數高校圖書館都使用“一卡通”刷卡或指紋識別確認身份的情況下,更高效精準的人臉識別技術為提高圖書館服務效率與質量、提升用戶體驗提供了新的契機。
以人臉識別技術在圖書館中的應用為主題的論文最早出現在2012年[6]。經筆者檢索,CNKI收錄的圖書館應用人臉識別技術的文獻一共有15篇,圍繞著人臉識別技術在圖書館中的應用,提出了應用理論及實現技術方法。通過分析文獻發現兩個問題,首先是較少有學者關注這一領域,相關研究的數量較少。其次,對人臉識別技術在圖書館的應用研究不深入。研究總體偏重于對在圖書館中應用人臉識別技術的可行性與功能的理論概述,未構建起人臉識別技術應用于圖書館的整體框架,建立完備的應用系統。由此可見,這一研究領域尚未得到學者的廣泛關注,研究空間十分廣闊。
人臉識別技術產生較早,但因其核心算法的局限性,在精度和速度上無法滿足大規模推廣的要求,導致早期發展較為緩慢,應用程度遠低于IC卡識別、指紋識別以及虹膜識別等。近些年人工智能迅速發展,人臉識別技術已足夠成熟,可為高校智慧圖書館的建設提供技術支持。
身份識別主要有物品驗證和生物特征驗證兩種方式。目前,我國高校圖書館普遍使用的身份認證方式是物品驗證,即通過人攜帶的磁卡、密碼等物品驗證身份,比如“一卡通”的應用等。使用物品驗證方式極易出現證件、卡片丟失,遺忘密碼、信息偽造的情況,與生物特征驗證方式相比較存在明顯弊端。生物特征驗證方式主要包括指紋識別、虹膜識別和人臉識別等,由于人身上的生物特征是與生俱來、唯一且極難被偽造的,這種驗證方式具有較高的準確性和安全性。虹膜識別技術和指紋識別技術與人臉識別技術相比,存在一定的缺陷。虹膜識別時,由于對采集的虹膜圖像要求極高,需要被識別者有著極高的配合度,不能眨動眼睛,長期使用對眼球有輕微損傷。在指紋識別的過程中,會出現某些人或某些群體的指紋特征少、難成像的情況,并且每一次識別時都在指紋采集機器上留下被識別者的指紋印痕,不僅存在被復制指紋的可能性[7],并且還造成了一定的公共衛生隱患。而人臉采集設備幾乎可以在被識別者無意識的狀態下獲取人臉圖像[8],既使用戶在最自然的狀態下完成身份識別,又無需與設備直接接觸,干凈衛生。通過以上分析,人臉識別既優于圖書館普遍使用的IC卡識別,又避免了指紋、虹膜識別的弊端,是高校智慧圖書館在身份驗證方式上的最佳選擇。
本文構建的基于人臉識別技術的高校智慧圖書館系統主要由兩大模塊構成,即身份認證模塊和權限應用模塊。身份認證模塊是將采集到的人像特征與人臉特征數據庫通過特定算法進行比對,完成身份的認證后進入權限應用模塊,用戶和工作人員可開展各自權限范圍內的應用。基于人臉識別技術的智慧圖書館系統結構如圖1所示。

圖1 高校智慧圖書館系統結構圖
身份認證模塊是判斷是否擁有某種應用權限的模塊。身份認證模塊以人臉識別技術作為技術支撐。早先的人臉識別技術多是Adaboost(一種迭代算法)、PCA(Principal Component Analysis,主成分分析)等傳統的統計學方法,人工智能深度發展后,出現了CNN(Convolutional Neural Networks,卷積神經網絡)、RCNN(Region CNN,基于區域的卷積神經網絡)等深度學習的算法,此類算法在識別精度和速度上已經有了質的提高。隨著這些核心算法的完善,人臉識別技術應用在智慧圖書館建設上有了算法支持。人臉識別技術主要由四部分組成:人臉圖像采集及檢測、人臉圖像預處理、人臉圖像特征提取以及匹配與識別[9]。本研究所要建立的高校智慧圖書館身份認證模塊流程如圖2所示。

圖2 高校智慧圖書館身份認證流程圖
圖書館采集本館用戶和工作人員的人臉圖像,經過預處理后提取特征信息,建立起人臉特征數據庫。在身份認證時,采集人臉視頻提取圖像,將人臉特征同數據庫進行比對,識別成功則完成身份認證,具備執行某項應用的權限,識別不成功則重新采集人像再進行身份認證。
經過身份認證后,系統便給予用戶或工作人員相應的應用權限,實現某種功能。本系統的運作核心是依托于人臉識別技術的身份認證,在進行每項活動時,都必須首先通過人臉識別認證確認身份,這也是系統功能實現的前提。在本系統中,通過人臉識別進行身份認證,自動將進館人員分為兩類,即用戶和工作人員,并賦予用戶權限和工作人員權限。用戶權限包括門禁識別、自助借閱、自助打印復印、預約座位等,工作人員權限包括簽到打卡、安全管理等。系統各項應用的授權流程如圖3所示,各項權限應用的功能圖如表1所示。

圖3 高校智慧圖書館授權流程圖
用戶和工作人員通過人臉識別可以輕松便捷地獲取各自類別的權限,這是圖書館服務和管理方式走向智能化的創新性變革。它摒棄了原有的繁雜程序,只要人臉識別成功,用戶便可以無障礙地享受圖書館多樣性的服務,用戶體驗感得到顯著提升,這符合智慧圖書館“以用戶為中心”的宗旨。本系統也使得圖書館管理工作的開展更具便捷性與安全性,提高管理效率,促進圖書館為用戶提供更優質的服務,形成良性循環,成為高校智慧圖書館實現智能化的重要手段。

表1 高校智慧圖書館權限應用功能圖
本系統的核心是人臉識別算法,人臉識別算法經過幾十年的發展,涌現出多種不同的算法。在多種人臉識別算法中,筆者認為選擇PCA算法比較適用于高校智慧圖書館人臉識別管理系統的搭建。高校圖書館用戶數量較小,故建立的人臉特征數據庫容量相應較小,并不要求過高的識別精度,故在識別速度和精度上經典的PCA算法完全可以滿足需求。再者,PCA算法易于實現,成本低廉(一款酷睿I7的計算機就可實現實時識別)。以下就PCA算法原理以及利用Matlab軟件進行模擬人臉識別作進一步的分析。
PCA算法基于統計學觀點,是人臉識別領域的經典算法之一。Kyungnam Kim[10]指出PCA算法進行人臉識別的核心思想是從人臉圖像中找出最能代表人臉的特征空間,即從人臉的多維度特征中解析出主要的特征向量,這一步主要通過依照所占能量權重將特征向量排序,從而達到將特征空間從高維空間降到低維子空間的目的。一張人臉圖像映射到這個空間會得到一個系數向量,如果兩張圖像映射到同一特征空間后得到的系數向量近似,則判定為同一個人,故也稱作Eigenface(特征臉)算法。PCA算法主要分為學習和測試兩個模塊,其中學習模塊通過機器學習算法,建立人臉圖像特征數據庫;測試模塊主要是測試算法系統的準確度。PCA算法的學習模塊流程圖如圖4所示。

圖4 PCA算法流程圖
筆者采用著名的ORL靜態人臉數據庫(http://www.cam-orl.co.uk),其中包含40個人,每人有不同角度的人臉圖像10張,共400張人臉圖像。如圖5所示,(a)為前8個人的第一張人臉圖像,(b)為400張人臉經處理后得到的平均臉圖像,(c)為前8個人的第一張人臉圖像的差值臉。

圖5 PCA算法核心步驟測試圖
經過Matlab軟件對PCA算法的測試,在學習階段發現排名90%以后的特征向量所占的能量太小,故采用前90%的特征向量當作主成分。如圖6所示,(a)為第一個人的第一張臉部圖像,(b)為前n個特征所占的能量百分比,(c)為第n個特征所占能量百分比。

圖6 人臉主成分分析圖
實驗結果表明,PCA算法的識別率基本可以滿足識別精度的需求(訓練樣本為50%時,即5張用于學習階段,5張用于識別階段時精度為79.8%;訓練樣本為70%時,精度為83.2%;訓練樣本為90%時,精度為86.5%),該算法可以作為本研究中人臉識別模塊的技術支撐。
本文提出基于人臉識別技術的高校智慧圖書館系統,一改傳統的IC卡認證方式,使得用戶便捷地獲取更優質的圖書館資源及服務,為工作人員高效管理圖書館提供了全新的平臺。通過該系統,圖書館可以構建起一個“去卡化”的無障礙獲取應用和服務的環境,最大程度地便利用戶,提升用戶體驗。目前,該技術應用于高校圖書館時機已成熟,因此它的應用必將為高校圖書館轉型升級帶來契機,為高校智慧圖書館的構建與發展帶來驅動與支撐。