摘 要:文章分析了圖書館智能問答系統的開發現狀,指出了該系統的優勢,即實現了對讀者咨詢的即時反饋、整合了高校圖書館資源、提高了辦公效率等。 構建的智能問答系統包含數據平臺、核心運算、接入端口與讀者觸點四級架構,并對系統的主要功能進行設計,以實現系統的語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、語音合成(TTS)等核心功能,以期解決高校師生在圖書借閱、資源訪問等過程中遇到的問題,提高學習及科研效率。
關鍵詞:高校圖書館;智能問答;圖書借閱;資源訪問
中圖分類號:G258. 6
文獻標識碼:A
文章編號:1003-1588(2024)10-0083-03
1 背景
隨著館藏資源日益豐富,高校圖書館服務已從傳統的資料借閱擴展到泛在式借閱服務、空間服務、科研服務、個性化咨詢等多個領域。 雖然服務方式和服務內容增加了,館員數量卻基本沒有變化。 高校圖書館咨詢業務具有重復性和規律性的特點,智能問答系統在該場景下的應用具有無可比擬的優勢。 智能問答系統不僅能夠顯著提升高校圖書館服務效率,還能大幅減少重復性工作。 特別是全天候、泛在式的智能問答系統,即使在工作人員下班期間,也能提供持續的咨詢服務。 這樣的系統不僅節約了高校人力資源,還提高了圖書館信息處理的自動化水平,極大地方便了廣大高校圖書館讀者。
2 高校圖書館智能問答系統的開發現狀
目前,高校圖書館智能問答系統形式多種多樣,包括基于 QQ、微信、微博等社交媒體工具的咨詢、智能在線客服咨詢以及 CALIS 虛擬參考系統咨詢等 [1] 。 這些系統可以通過一問一答的形式精確定位高校圖書館讀者所需的知識,并提供交互服務 [2] 。 當高校圖書館讀者提出問題時,系統會自動分析已輸入的內容,提供優化的補全或相關提示,對焦點問題進行自動排序。 同時,系統還會自動鏈接與
關鍵詞相關的業務列表,形成業務熱點關鍵詞 [3] 。 通過引導交互式服務,系統能夠有效解決讀者常見問題。 以清華大學圖書館聯合西安曉多智能科技有限公司合作開發的“清小圖”智能問答系統為例,該系統可以自動應答關于圖書借還、電子資源、座位預約、館藏目錄、館內服務等方面的圖書館常見問題。 此外,“清小圖”還可以通過聊天的形式實現館藏資源的快速查詢,為讀者提供不受時間地點限制的全天候智能咨詢服務。
3 高校圖書館智能問答系統的優勢
3. 1 高校圖書館智能問答系統實現了對讀者咨詢的即時反饋
高校圖書館智能問答系統融合人工智能技術和自然語言處理技術,搭建了一個智能化的解答平臺,旨在構建一個“無時不在、無處不在”的泛在化答疑環境,能夠有效解決讀者使用圖書館時遇到的問題。該系統針對高校圖書館服務中常見的問題進行了定制化回答,相當于給每個讀者都配備了一個在線答疑館員。
3. 2 讀者的學術搜索助手
高校圖書館智能問答系統整合了文獻管理工具、會議論文、多媒體資源、學位論文、期刊論文、電子圖書、國家標準、報紙全文、工具書、年鑒、圖片、文摘、科技成果、專利、科技報告等應用中的常見問題,能夠自動回復高校圖書館使用者在學術搜索過程中提出的疑問。 該系統能助力高校圖書館使用者進行高效的學術搜索,滿足其學術知識獲取需求。
4 高校圖書館智能問答系統的設計
筆者根據高校圖書館資源利用存在的各項問題設計了智能問答系統,該系統可以回答使用者提出的各類問題。 這一系統可以理解讀者的自然語言提問,精準捕捉讀者的意圖并將答案直接返回給讀者 [4] 。
4. 1 系統的整體構架
4. 1. 1 數據平臺。 數據平臺在該系統中的主要功能是知識庫儲存與信息記錄,包含知識庫修改與編輯、近期數據詳情記錄、知識盲區查閱與編輯四項基本功能。 知識庫的修改與編輯是系統應滿足的基礎功能,即對現有問答或知識卡片進行更新與修正;近期數據會記錄某個或某類問題的關注度,以及不同ID 讀者的問題傾向。 系統通過這些問題可以了解近期讀者對圖書館相關內容的關注情況。 使用者提出的系統暫時無法回答的問題被稱為“知識盲區”。通過對“知識盲區”的查閱與編輯,系統可以有針對性地對問答進行補充,從而不斷擴充知識庫。
4. 1. 2 核心服務。 系統主要提供三大核心服務:智能交互服務、知識管理與問答服務、數據服務。 智能交互服務依賴于語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG)以及語音合成(TTS) 這五類關鍵技術。 其協作流程如下:讀者輸入聲音,經麥克風陣列采集后,通過語音識別轉化為文字,再經自然語言理解處理,隨后 DM進行分析并聯通數據庫查詢、抽取答案,接著通過自然語言生成技術轉化為可理解的文本或指令,最后經語音合成并由揚聲器播放給讀者,從而完成整個問答回路。 在知識管理和問答服務中,系統需要實現知識的篩選與匹配、管理問答、知識圖譜問答、啟發式問答以及知識庫的管理與遷移等核心功能。 數據服務則涵蓋了數據的存儲、抽取及遷移等過程。 將數據服務架構在云端,可以減少設備響應時間,避免本地數據冗余,進而提升問答效率并降低維護成本。
4. 1. 3 接入端口。 高校圖書館使用者常用的通信工具日漸豐富,因此系統接入端口的設置也應多樣化,以便兼容各類應用程序和基礎網頁。 目前,主流的接入模式有媒體資源控制協議、會話初始協議、應用程序接口及其他軟件開發工具包等。
4. 1. 4 讀者觸點。 讀者觸點包括交互平臺以及系統本身的界面設計,它是系統與高校圖書館使用者進行交互的關鍵環節。 多樣化的端口可以將系統及其部分功能進行移植和再現,這樣高校圖書館使用者就能夠通過其常用接入端口上的應用程序訪問系統。 這些系統不僅進一步簡化了操作流程,還具備同類問題溯源功能,能夠主動引導話題。 同時,系統會根據讀者反饋進行持續學習,進而深入挖掘并理解高校圖書館使用者的真實需求。
4. 2 系統實現方案
系統采用前端與后端分離的實現方式。 前端可以通過豐富的接口與各類應用程序和系統實現無縫對接,從而拓寬了本系統的使用環境和應用范圍;后端則采用了多級架構,根據功能的不同而拆分成相互獨立的服務模塊,這些模塊以低耦合的方式高效完成各項任務,并通過應用程序接口(API)獨立連接到各應用場景中。 為了提升系統的整體協作性,各模塊之間需要有效的互聯互通,以便為讀者提供完整且便捷的服務。 在智能問答的核心功能實現過程中,一部分信息通過網絡獲取,利用了如 Python、Flume 等技術;另一部分信息則是先由管理員手動置入系統,之后再通過 WebSocket 關聯系統業務層進行連接。
5 高校圖書館智能問答系統的實現
5. 1 數據庫的建立與獲取
系統采用關系型數據庫并儲存在云端。 系統能夠通過網絡進行數據庫內容的調用。 知識庫的來源主要有兩種方式:一種是手動導入,另一種是網絡獲取。
5. 1. 1 手動導入。 需要手動導入的知識內容涵蓋多個方面,如:開館情況、圖書借閱規則、圖書遺失賠償流程、圖書薦購、科技查新、知識產權信息服務、論文查收查引、原文傳遞、館際互借等內容。 手動導入有固定的格式要求。
5. 1. 2 網絡獲取。 通過網絡獲取的知識通常是普遍性的、不隨時間發生顯著變化的內容,如:“某一數據庫包含哪些內容”或“查新工作的流程是什么”等。 在接收到相關問題后,系統會進行問題的理解與
關鍵詞的整理,隨后通過 Python、Flume 等技術手段進行數據收集,并最終完成問答匹配。
5. 2 自然語言理解(NLU)的實現
5. 2. 1 自然語言理解的運行模式。 自然語言理解提供了對接收到的提問請求文本進行語義處理的功能,該功能包括詞法分析、意圖識別、語義槽抽取、文本相似度計算、多意圖排序以及知識推理。 系統首先使用中文 DNN 語言模型進行糾錯,該模型依托網絡數據和深度神經網絡技術,能夠判斷語句是否符合語言表達習慣,實現文本的糾錯與補充 [5] 。 完成糾錯后,文本會進入詞法分析與文本相似度分析階段,以進一步深入理解讀者的真實需求,同時提升運算速度。
5. 2. 2 自然語言理解的核心算法。 為了提升自然語言理解的準確性,系統會根據問題模式的不同,采用大規模意圖識別算法、場景感知的統計意圖理解與規則意圖理解算法,對 NLU 進行部署與優化。 讀者輸入的每個句子,通常包含一定的實體、動作與關系。 算法需要將這些元素轉化為可理解的語義表示,這些元素包括領域(domain)、意圖(intent)和槽(slot)。 例如,在“圖書館中座位預約的規則是?”這句話中,其語義將被表示為:
Domain=book—圖書館
Intent=詢問規則
Slot:{chapter=座位預約,content=規則}
針對一些例外情況,系統補充使用了非神經網絡處理技術,即基于有限狀態機(FST)的規則處理方法。 這種方法將大量明顯特征以及讀者定制特征編譯成有限狀態機的共用體(Union)。 對輸入句子做序列掃描時,由這些規則生成的有限狀態機能夠捕捉到句子的關鍵特征,以此作為確定語義意圖的依據。
5. 3 對話管理的實現
對話管理(DM)主要是進行多輪對話管理、上下文管理、相關知識點推薦等。 根據問答需求的不同,對話類型被劃分為任務型對話、知識問答型對話與啟發式對話。
5. 3. 1 任務型對話。 任務型對話是指面向高校圖書館使用者的問答對話,如:“館藏圖書隨書光盤如何借閱?”當系統收到提問后,首先會判斷問題的具體任務類型并提取讀者的需求參數。 系統會持續收集不完善的信息,直到所需參數被完整收集。
5. 3. 2 知識問答。 知識問答的核心是以問答的形式組織知識。 系統會將高校圖書館使用者的提問與問答對中的問句進行比較,找到最匹配的項,并將相應的答案返回給讀者。
5. 3. 3 啟發式對話。 這是一種基于被動式對話的人機交互模式,即系統理解讀者的大致意圖后,會根據讀者當前關注并詢問的話題,主動規劃后續話題的內容,并對當前知識點提出建議,同時主動推薦與該類知識相關的咨詢服務,以達到觸類旁通、舉一反三的效果。
5. 4 語音合成技術的實現
通過內置芯片與神經網絡的支持,TTS 技術能夠智能地將文字轉化為自然流暢的語音流。 為了進一步提升語音的真實度和流暢度,系統采用了類WaveNet 技術的高音質神經網絡聲碼器,極大地提升了播放語音的真實性 [6] 。
6 結語
基于智能問答技術的高校圖書館智能問答系統,是專為滿足高校讀者需求而精心設計的。 該系統利用四級架構構建整體框架,能夠有效且迅速地回應讀者在資源使用、圖書借還、圖書薦購、科技查新委托、專利信息服務、查收查引、館際互借、原文傳遞等方面的咨詢,確保讀者問題及時得到解決。 同時,通過構建數據庫,該系統有效減少了高校圖書館工作人員在重復性咨詢工作上的時間消耗,節省了人力資源,從而在一定程度上解決了圖書館工作人員短缺的問題。
未來,圖書館應重點關注系統的流暢性、創新性及實用性需求,包括但不限于進一步優化系統代碼與工作流程、開發便捷的小程序等策略,進而不斷優化讀者體驗,使智能問答系統在圖書館服務中發揮更大的作用。
參考文獻:
[1] 蔣逸穎,蔣逸婷. 圖書館“雙一流”高校圖書館智慧服務現狀研究[J]. 圖書館研究與工作,2023(8):77-81.
[2] 趙瑞雪,黃永文,馬瑋璐,等. ChatGPT 對圖書館智能知識服務的啟示與思考[J]. 農業圖書情報學報,2023(1):29-38.
[3] 劉桂蘭,孫俊. 基于微信的移動學習平臺分析與設計[J].通訊世界,2015(16):234-235.
[4] 張攀峰,尋素華,吉麗曉. “智能學伴”在小學游戲化學習社區中的情感交互設計[J]. 中國電化教育,2014(10):123-128.
[5] 孫茂松,劉挺,姬東鴻,等. 語言計算的重要國際前沿[J].中文信息學報,2014(1):1-8.
[6] 伍宏傳,凌震華. 神經網絡聲碼器的話者無關與自適應訓練方法研究[J]. 小型微型計算機系統,2019(2):445-450.
(編校:周雪芹)