欒 江 賈穎華
近年來,人工智能技術取得了前所未有的發展成果,在很多領域內都扮演著不可或缺的角色,比如自動駕駛、機器人等。文中上海體育學院將人臉識別技術融入高校檔案利用綜合業務,對接云端AI開放平臺開發的遠程智慧查檔系統改變了大學檔案館檔案利用服務模式,終結了調檔人必須親自來校辦理查檔業務的歷史,是大學“讓數據多跑路,讓群眾不跑路”AI+業務的創新型應用[1]30。這套系統開發完成后正遇到新冠肺炎疫情,系統自帶的“無接觸”屬性,使上海體育學院檔案館即使在疫情期間也沒停止過對外的檔案利用服務。基于AI技術的遠程智慧查檔系統不僅得到查檔人的高度評價,同時也得到檔案館界同行們的高度關注。
研究主要從基于AI技術的遠程智慧查檔系統的創新點、架構點、功能點展開,并輔以數據統計分析,總結出系統的應用效果,希望能對其他學校、企事業單位的檔案利用服務提供參考。
查詢文獻發現學者們提倡構建“資源、管理、服務”三位一體的檔案體系架構[2]17,以實現“面向資源”到“面向服務”的轉變[3]245,希望通過平臺建設實現傳統的檔案館快速轉型為智能化、個性化、全服務的智慧檔案館[4]76。但文獻以平臺框架形式呈現為主,缺少智能技術融合應用的創新案例。項目組研究開發的系統正是AI開放平臺與我校基礎平臺融合創新的產物。
1.引入成熟、可信的AI開放平臺。通過調研發現,上海體育學院是上海高校第一家使用AI人臉核驗身份提供遠程查檔服務的學校。校檔案館提供查檔服務,首先需要檔案管理員核驗申請人的身份,確認查檔人為校友或在校師生后為其調取相關檔案,并將蓋有檔案章的檔案掃描件或復印件給予查檔人。因此,技術上首先需要解決的就是如何準確辨識出異地查檔人的真實身份。我們的解決方案是共享權威機構的公民人臉庫,調用成熟的AI人臉識別技術完成異地查檔人的身份核驗。通過反復測試,系統對接了人臉識別率高、算法世界領先、提供Open API(Application Programming Interface,應用程序編程接口)調用的某知名成熟AI開放平臺,調用權威數據源,精確判斷用戶身份真實性,從而解決了“誰是誰”的問題。另外,查檔人身份核驗后還需在線提交在校期間的關鍵數據,如畢業年份、畢業院系、專業、學位證、畢業證等,通過信息匹配進一步確定他的校友身份。
2.基于已有平臺的快速開發集成模式。調研還發現上海體育學院也是全國第一家在自建網上辦事平臺啟用AI人臉核驗身份技術開展校友服務的大學。該系統在完成校友身份核實后,申請人的查檔需求就會在多個檔案管理員之間流轉,有負責信息登記、轉辦、統計的,有到庫房調取檔案的,有掃描或復印的,有負責蓋章的,還有負責檔案快遞服務的。基于學校檔案館和信息辦人手少的現狀,我們沒有采用檔案館獨立采購遠程查檔系統的模式,而是利用學校原有的網上辦事平臺做二次開發和接口集成。網上辦事平臺的移動端已集成企業微信、校園統一身份認證、統一消息推送(微信消息、手機短信、郵件)等功能,以上功能全部都直接復用于智慧遠程查檔系統,做到了系統集成的事半功倍。而采購獨立遠程查檔系統的單位則需要讓第三方公司就統一身份認證、移動端入口、消息推送接口、數據交換等多個接口分別做集成實施,耗時耗錢。如不做,新的遠程查檔系統就會變成單位一座新的“信息孤島”。這套方案不僅減少了檔案管理員學習和使用另一套新系統的時間成本,而且檔案管理員還會在學校網上辦事平臺上辦理面向校內師生的其他服務,校檔案館用實際行動提升了業務信息化水平,對學校“一網通辦”事業作出了貢獻。另外,由于網上辦事平臺的查詢、統計功能可以多流程復用,因此與其他高校采購新的遠程查檔系統相比,上海體育學院基于網上辦事平臺的遠程查檔系統不僅開發集成周期更短、功能更全、成本更低,還減少了技術人員的系統培訓、運維成本,檔案館老師也只需關注業務需求本身,不必為系統管理、運維犯愁。此方案新在“共享”,結果就是“共贏”。
基于AI技術的遠程智慧查檔系統整體架構(如圖1所示),AI開放平臺提供人臉識別接口供遠程查檔系統調用;查檔移動端UI(User Interface,用戶界面)功能和網上辦事平臺上校友查檔申請流程是用戶能感知的功能模塊;學校的數據中心平臺按統一的信息標準存放系統產生的數據,并在數據量積累到一定程度后通過ETL(Extract-Transform-Load,數據抽取、轉換、裝載)工具軟件生成檔案利用主題數據庫;學校的基礎設施平臺提供遠程查檔系統部署所需的網絡、計算資源等;利用BI(Business Intelligence,商務智能)工具軟件,基于檔案利用主題數據庫進行數據可視化分析,為軟件迭代和檔案利用服務優化提供決策支持;另外,系統必須遵循學校的統一信息標準,并在統一安全監管下運行。

圖1 基于AI的遠程查檔系統架構示意圖
該系統架構的特點是低耦合性、高擴展性、低風險性。從架構圖中讀者可以直觀地看到系統各部分之間都是低耦合的,也就是說在各部分接口開放的情況下可以自主替換某部分,而不會影響系統整體功能。比如,市面上出現資費更低的人臉識別AI平臺,工程師只需要修改架構圖中的接口語句就可直接替換,其他部分無需改動。架構圖中都是平臺產品,高可用、高性能、跨平臺,使得系統架構具備很強的可擴展性。比如,當檔案館老師提出查詢、統計、報表新需求時,工程師可以直接在網上辦事平臺快速開發上述功能。關于檔案利用方面的數據交換、分析、挖掘都可以在數據中心平臺上應需擴展。不少單位對采購人臉識別系統保持觀望態度,是因為擔憂指紋、人臉這些重要生物特征數據存放的安全問題。系統架構圖中云端的AI開放平臺以及人臉庫管理責任在提供云平臺功能的企業,學校系統里并沒有存放查檔人生物特征,因此可以消除學校對這類敏感數據安全監管的壓力。另外,系統數據統一存放在學校內網的數據庫里,數據中心平臺會對庫里的身份證、畢業證、學位證等敏感數據做脫敏處理。這樣“云網合一”,內網安全的架構設計使系統安全得到保障,從而降低了系統的使用風險。
1.智慧查檔系統入口。查檔人可在學校“網上辦事大廳”、“SUS檔案館校史館”公眾號、“上海體育學院校友會”公眾號里找到“遠程查檔”移動端入口。
2.AI身份核驗后提交查檔申請。查檔人根據文字提示在手機移動端完成人臉身份核驗,在線提交查檔申請。
3.其他管理功能。查檔人提交查檔申請后,檔案管理員會收到待辦手機短信,企業微信App也會收到校友查檔流程發給檔案管理員的消息提醒。檔案管理員可在PC端或手機終端查看、處理校友查檔申請,反饋辦理進度,查詢統計辦件等等。
查檔人可以通過手機端“查檔進度”隨時跟蹤查檔申請受理情況。當檔案管理員處理完查檔申請后,系統將會給查檔人發辦結短信,告知其查檔結果,所需檔案材料也可通過快遞送達異地查檔人手里。
上海體育學院師生規模小,往年查檔人次在600次左右。系統2020年6月上線,三個月就達到了往年1/3的辦件量。截至2020年9月30日,檔案管理員已通過系統辦結281人次的遠程查檔,其中選擇上門自取檔案的94人次,選擇物流傳遞檔案的172人次,約占查檔總人次的61%。我們以系統里常住地為四川省巴中市的校友為例,此系統可免去他乘坐飛機來回查檔的費用,還省去了他來回奔波的時間成本。
本項目投入經費少,社會效益較大。系統上線徹底解決了查檔人必須帶齊證件、跑腿奔波、排隊等候的難題,節省了查檔人的時間、精力和財力。該系統滿足了廣大師生和校友對檔案利用的需求,提供了更加便捷的檔案利用服務,特別是在疫情期間,真正實現檔案查詢利用的“無接觸”和“零跑腿”。這是凝聚業務和技術部門智慧的創新研究應用,也是檔案館和信息技術部門協同創新的價值體現。
雖然這套系統已達到預期設計目標,但項目組會將積累的數據進行抽取、清洗和轉換,設計檔案利用主題數據集模型,用數據分析和數據挖掘得出的結論來為系統升級迭代和檔案利用服務優化提供決策支持[5]216。