文/天津機電職業技術學院 毛妮娜
近年來,計算機領域人工智能技術快速發展,智能服務產品不斷成熟并向各行各業推廣,帶來了新的生機與活力。在2017年的《政府工作報告》中明確提出,要大力發展人工智能技術。在圖書情報與檔案管理領域,我國第六次全國公共圖書館評估工作明確提出數字參考咨詢成為省級(副省級)評估定級的加分項。因此,基于人工智能技術的智慧服務,尤其是參考咨詢類服務是未來一段時間內圖書館、檔案館的重點發展方向。
智能咨詢服務是指利用機器人模擬人類回復咨詢問題的服務方式。目前,智能咨詢服務在圖書館領域受到了極大關注,國內清華大學圖書館、上海交通大學圖書館等高校圖書館均已利用智能咨詢技術開展智能參考咨詢服務,并且取得了不錯的成果。相比較于傳統的咨詢服務,智能咨詢服務可以提供24小時在線服務,無需人員值守,無需占用單獨的服務空間,尤其是在當前新冠疫情時期,可以實現無接觸咨詢,減少感染風險。
高校的檔案管理工作是一項關系師生切身利益的重要工作,將人工智能技術與檔案咨詢服務相結合有其現實的需求性,主要體現為以下特征:第一,傳統的檔案咨詢服務依靠人工提供服務,在查檔高峰期,例如:開學季、畢業季、教師成果申報時段等,大多高校對于檔案管理工作無法提供足夠的管理人員,以至于面對大量的電話咨詢、郵件咨詢甚至現場咨詢無法提供及時、有效的回復;第二,移動設備的普及,手機、電腦的廣泛應用,讓用戶群體對于網上咨詢的需求越來越突出,咨詢需求的即時化、泛在化、個性化對目前主流的人工檔案咨詢服務提出了挑戰;第三,目前世界范圍內,新冠疫情持續爆發,傳統的人工檔案咨詢工作需要師生用戶與檔案管理人員直接接觸咨詢,是一種高傳播風險的方式,從用戶與檔案管理人員的安全角度考慮,將咨詢服務改變為非接觸的智能咨詢方式,也是當前時代的需求。與圖書館參考咨詢服務類似,師生用戶對檔案類的咨詢也具備共性特質,例如:查檔案需要攜帶的資料、查檔的時間、是否提供在線查詢方式等。智能咨詢服務可以完美解決這些問題,讓檔案管理工作徹底從大量重復性咨詢中解脫出來,集中時間、集中精力做好檔案管理、檔案信息化建設工作。因此,在高校中引入智能咨詢服務十分必要。
為探究我國檔案學研究領域有關智能咨詢服務的研究現狀,筆者結合文獻試檢過程,挑選與智能咨詢服務相關的同義詞、近義詞構造檢索式,最終以“檔案AND(智能咨詢OR智能問答OR智能回復OR自動回復)”作為檢索式,在中國知網全文數據庫提供的專業檢索途徑進行主題檢索,共得到8篇相關文獻。經過人工篩選,真正和檔案學智能咨詢服務相關的研究只有3篇。從研究數量角度分析,我國檔案領域有關智能咨詢服務的相關研究數量是明顯偏少的。
從研究內容分析,馬欣以移動網絡時代為背景,提出了利用微信平臺應用智能咨詢服務提升檔案管理服務中的智能化、個性化水平的建議;徐彤陽針對檔案多源數據的需求,構建了基于多源數據的知識服務智能問答模型。從知識庫構建角度為檔案領域搭建智能咨詢模型提供了參考;王雪荻在分析高校檔案咨詢服務現狀的基礎上提出了智能檔案信息咨詢服務模式,將智能檔案管理分為訓練端、管理端和訪客端三層架構,并分別闡述了各層的主要功能,為檔案領域智能咨詢服務的運行機制設計提供了參考。遺憾的是,該研究只是從基本功能角度對智能咨詢系統進行介紹并進行了有意義的探討,對于檔案智能咨詢服務模式的具體分析需要進一步加強。
基于上述研究內容可以看出,有關檔案領域智能咨詢服務的研究已經開始引起了領域內學者的關注,但是研究數量較少,研究角度、研究深度有待進一步加強。
按照智能咨詢服務的信息流向,可以將智能咨詢服務分為數據層、業務邏輯層和智能人機接口層。筆者將這一模型進行詳細分析,結合高校的特點,設計出高校檔案智能咨詢服務模型(如圖1所示)。
圖1 高校檔案智能咨詢服務模型
(一)知識庫。知識庫建設是智能咨詢系統建設中的重要環節,知識庫建設的好壞將直接影響智能咨詢系統的回復效果。針對高校而言,檔案智能咨詢服務主要目的是解決師生用戶查閱檔案過程中產生的咨詢提問,提供更加便捷的咨詢服務,減輕檔案員的工作壓力。因此,知識庫建設的目標應該是盡可能覆蓋用戶在查詢檔案過程中遇到的各種咨詢提問。基于此目標,可以從三種途徑建設知識庫:首先,應盡可能搜集互聯網上有關檔案的咨詢提問內容,例如百度百科、360百科等,并基于獲取內容形成有關檔案領域基礎知識的問答知識庫,用以滿足用戶對檔案基礎知識的提問,比如:學籍檔案包含哪些內容,從檔案中可以獲取哪些信息等;其次,應充分利用國內高校、高校檔案館(檔案室)所總結的FAQ問答內容,這些問答內容是基于用戶的日常提問總結的,考慮到檔案管理的規范性、統一性,FAQ問答可以在一定程度上提取用戶咨詢的共同提問,快速建設高質量的知識庫;最后,本校檔案管理人員是長期服務于用戶的一線人員,對于本校用戶的提問特點、本校的查檔的規章制度、檔案提取流程等有豐富的知識和經驗,基于本校管理人員的本校特色知識庫建設將更加具備本地特色,更精準地滿足本校師生查檔時產生的咨詢需求。
檔案知識庫建設的另一個重要內容就是對知識問答的組織方式,由于不同類型的檔案具有不同的特點,使用方式也存在一定的差異,所以,應以檔案的分類作為信息組織方式。例如,將知識庫分為:人事檔案、科研檔案、教學檔案、基建檔案等,以及其他專項檔案、特色檔案。
(二)算法邏輯。算法邏輯是聯通知識庫問答知識與讀者咨詢提問的橋梁。與知識庫的重要性相類似,檔案智能咨詢的核心功能是對用戶咨詢提問內容的理解。當用戶發出查詢請求時,智能問答系統首先要對查詢提問內容進行解析與推理,通常要對用戶提問進行分詞處理用以提取用戶提問的關鍵詞語,常用的分詞方法包括結巴分詞、Stanford NLP、中科院計算所ICTCLAS、HanLP等。分詞完成后,可根據預先建立候選關鍵詞問題集,計算問題與知識庫內提問的相似度,查找相似度符合的問題和答案,將對應的結果返回輸出給用戶。目前常見的邏輯匹配算法包括:基于范例推理、關鍵詞匹配、人工智能標記語言邏輯推斷、向量空間模型計算相似度、深度學習等。檔案智能咨詢服務可以根據實際情況選用其中的一種或者幾種方案作為核心算法邏輯,進行知識匹配。
(三)交互展示。交互展示是系統與用戶咨詢問答的窗口,常用的交互途徑主要包括:網站、微信公眾號和移動APP,考慮到移動服務已經成為主流,而獨立開發、維護一個APP的難度較高,再結合當前國內對于基于微信公眾號開展檔案咨詢服務的研究越來越成熟,微信公眾號的智能咨詢服務可以作為高校檔案智能咨詢服務的首選途徑。
用戶與系統的功能交互內容應包含兩部分:問答交互以及用戶反饋。其中問答交互是指用戶提出咨詢提問,系統根據讀者咨詢提問內容選擇知識庫內最相關的答案返回給讀者,這是檔案智能咨詢服務的核心功能模塊;用戶反饋是指用戶在收到系統返回給自己的答案后,根據答案與自己提問的相符合程度,對本次咨詢問答的反饋內容。用戶反饋的主要目的是基于用戶真實使用體驗對知識庫內知識問答、算法匹配效果進行評價。尤其是對于知識問答內容的反饋,是優化知識庫內容,以滿足用戶需求的最佳途徑。
在智慧服務成為主流的信息技術時代,高校檔案咨詢服務應緊跟時代潮流,利用智能技術改變傳統的人工咨詢服務方式,為用戶提供更加方便、快捷、非接觸式的咨詢服務是檔案咨詢服務發展的必然要求。本文基于檔案領域智能咨詢服務的研究現狀,將傳統人工檔案咨詢服務與智能咨詢技術相結合,構建了檔案智能咨詢服務模型框架,從知識庫、算法邏輯、交互展示3個層次對高校檔案咨詢服務智能化建設進行理論探討。
同時,除了模型提到的功能外,有關檔案智能咨詢服務的探討不應局限于當前智能咨詢服務所具備的功能,還應結合檔案數字化建設的未來發展和最新的人工智能技術手段進行規劃。
國家檔案管理有明確的法律、法規和政策,檔案數字化必須遵循有關規定,在嚴格保障安全的前提下進行。在符合國家規定的同時,海量的數字化檔案信息中也蘊含著大量的潛在價值信息。如何充分挖掘這些信息,為用戶提供更加方便、快捷的服務,以實現檔案服務創新,顯得十分重要。檔案智能咨詢服務平臺應充分結合檔案的數字化發展趨勢,在常見咨詢服務的基礎上,融合數字化檔案中獲取的有價值信息,在確保數據安全和用戶身份認證的基礎上,為用戶提供除了日常咨詢之外,更深層次的服務,從被動服務轉為主動服務。
人工智能技術正處于井噴式快速發展階段,以用戶畫像技術為代表的用戶個性化服務目前正在呈現多點爆發的研究態勢,受到了相關領域學者的重視。基于用戶畫像技術為用戶提供更多個性化檔案推薦服務,可以讓用戶在瀏覽檔案信息的同時獲取更多的檔案資源。基于用戶畫像技術,可以讓數字化檔案以新的方式得到開發與利用,進一步推動高校檔案數字化的建設和檔案服務轉向數據服務和知識服務。