


摘 要:文章簡述了國家圖書館交互式線上咨詢服務的發展歷程,在介紹大模型賦能的國家圖書館智能問答系統的兩大內容支撐——FAQ語料庫與文檔語料庫的基礎上,重點闡述了FAQ語料庫內容的建設實踐及管理與運營流程。針對系統上線運行半年多以來FAQ語料庫承接的問答式對話的日志和部分問題未命中的原因進行了統計分析,并從內容優化和來源拓展、建設標準的制訂、大模型智能化水平優化、日常運維和多渠道復用、評價體系建設、團隊建設與人才培養等維度,提出FAQ語料庫建設的發展策略和建議,以期為大模型在圖書館智能問答等基礎服務中的應用和發展提供參考。
關鍵詞:國家圖書館;智能問答;大模型;FAQ語料庫;咨詢服務
中圖分類號:G250.7""" 文獻標識碼:A"" 文章編號:1003-7136(2025)02-0080-08
Practice and Reflection on the Construction of FAQ Corpus of Intelligent Question Answering System Empowered by Large Models: Case Study of the National Library of China
ZHAI Rong
Abstract:This paper briefly describes the development process of interactive online consulting services of the National Library of China.On the basis of introducing the two major content supports of the intelligent question answering system empowered by large models-FAQ corpus and document corpus, it focuses on the construction practice" of content, management and operation process of FAQ corpus.A statistical analysis was conducted on the logs and reasons for some of the missed questions in the Qamp;A dialogues undertaken by FAQ corpus since the system was launched and operated for more than half a year.From the perspectives of content optimization and source expansion, formulation of construction standards, optimization of the intelligence level of large models, daily operation and multi channel reuse, evaluation system construction, team building, and talent cultivation, development strategies and suggestions for the construction of FAQ corpus were proposed, in order to provide reference for the application and development of large models in basic services such as library intelligent question answering.
Keywords:National Library of China;intelligent question answering;large model;FAQ corpus;consulting service
0 引言
提供高質量、便捷性的咨詢服務,是圖書館向智能化和智慧化轉型的重要環節[1]。生成式人工智能(Artificial Intelligence Generated Content,AIGC)和大模型技術的引入迅速沖擊著各領域的交流互動模式,人工智能技術從“判別式”發展為“生成式”[2]。當前,AIGC和大模型技術的引入,同樣影響著圖書館交互式線上咨詢服務的變革方向[3]。為實現智慧化轉型,國家圖書館對基于NLP1.0技術構建的智能問答系統進行全面升級,推出了大模型賦能的國家圖書館智能問答系統,拓展了智能問答服務的廣度和深度,優化與完善了智能問答服務的綜合性能和服務效能。文章通過闡述大模型賦能的國家圖書館智能問答系統FAQ語料庫建設的實踐和思考,介紹了FAQ語料庫建設現狀和運行情況,以期為大模型在圖書館智能問答等基礎服務中的應用和發展提供參考。
1 國家圖書館交互式線上咨詢服務的發展歷程
國家圖書館交互式線上咨詢服務歷經了近20年的發展歷程,自2005年5月上線的虛擬參考咨詢服務系統,至2023年上線的基于NLP1.0技術構建的智能問答系統,再到2024年4月23日上線的引入AIGC與大語言模型(Large Language Model,LLM)等構建的國家圖書館智能問答系統,實現了從人工到人工智能的轉變,拓展了交互式線上咨詢服務的時間維度和空間維度,提升了讀者咨詢服務的個性化、精準化和滿意度,成為國家圖書館向智慧圖書館轉型的重要舉措之一[4]。
2005年5月正式上線的虛擬參考咨詢服務系統,采用純人工服務的方式,具有實時咨詢和表單咨詢、文件推送、網頁推送、窗口共覽、咨詢館員對話、咨詢傳遞等功能[5]。為搭建一個更加高效的交互式線上咨詢服務平臺,國家圖書館自2022年底開始投入智能問答系統的建設,該系統是基于NLP1.0技術構建的以人工智能咨詢為主、人工咨詢為輔的在線咨詢平臺,于2023年4月23日上線,提供檢索和文獻輔導、讀者咨詢解答、讀者閱讀和深度參考咨詢導引等服務,提升了面向讀者的快速咨詢服務能力,豐富和改善了讀者體驗,為實現對讀者綜合咨詢信息行為數據的收集和分析等方面提供了全新的應用服務支撐,提升了國家圖書館讀者服務的智能化水平。
為適應國家圖書館向智慧圖書館轉型的目標,進一步增強讀者咨詢服務的個性化、精準化和精細化,國家圖書館與北京百度網訊科技有限公司合作,引入AIGC與LLM等,對原有智能問答系統進行了全面升級,升級后的系統于2024年4月23日上線運行,在國家圖書館官網首頁的“智能問答”和微信公眾號“國圖參考”中的“國圖咨詢”兩個端口提供服務。該問答系統是基于AIGC技術的交互式線上咨詢服務系統,采用大模型賦能本地語料庫的形式,其語料支撐包括FAQ語料庫與文檔語料庫,同時對接館藏揭示平臺,并由大模型通識知識參與。其中,FAQ語料庫旨在確保讀者咨詢的國家圖書館相關資源和服務類問題能夠得到準確答復,其內容覆蓋國家圖書館館情、資源、服務等常見問題及答案,如證卡辦理、閉架文獻預約方法及借書期限等。文檔語料庫除了包含一些服務政策和熱門活動的內容,還包括圖情領域相關知識以及47家副省級公共圖書館的服務和資源方面的內容。館藏揭示平臺則與全國圖書館聯合編目中心對接。該系統響應機制采用多引擎方式,當讀者提問時,系統首先將讀者咨詢問題與FAQ語料庫進行匹配;對于非高頻讀者問題,系統會啟動大模型賦能的文檔問答引擎,通過檢索自建文檔語料庫中的相關信息,生成準確回答;若FAQ語料庫和文檔問答引擎均無法解答,大模型將判斷讀者是否有“檢索館藏”的意圖,如果識別到書名、作者等關鍵信息,系統將在國家圖書館館藏揭示平臺檢索,并整合檢索結果進行答復;除上述之外的系統知識范圍內的其他問題,則由大模型通識知識進行回復;超出系統知識范圍的咨詢問題,將采用拒答話術進行回復。其中,采用通識知識的回復是依據互聯網搜索知識的回復,拒答話術則是以固定話術告知讀者無法解答該問題。其邏輯流程見圖1。
2 大模型賦能的國家圖書館智能問答系統FAQ語料庫的建設實踐
FAQ語料庫作為大模型賦能的國家圖書館智能問答系統的兩大內容支撐之一,發揮著重要作用。以下從內容建設和管理與運營兩方面,介紹FAQ語料庫的建設實踐。
2.1 FAQ語料庫的內容建設
FAQ語料庫內容的來源渠道較為多元,包括國家圖書館官網主頁常見的讀者問題、虛擬咨詢服務系統中的讀者咨詢檔案,以及基于NLP1.0技術構建的智能問答系統語料內容和問答日志。其中,讀者咨詢檔案既收集了以綜合咨詢臺為主要服務形式的到館咨詢中的高頻問題,也包含了遠程咨詢服務中常見的咨詢問題。智能問答系統語料內容和問答日志方面,除了充分參考和利用基于NLP1.0技術構建的智能問答系統的語料內容之外,項目團隊從該系統的3萬余條人工智能問答日志中,篩選出讀者服務相關的高頻問題作為補充。此外,還向全館各業務部門征集得到讀者服務高頻問題相關的FAQ語料167條,這項工作調動了全館力量共同參與,為語料庫建設擴容的同時,也為語料內容的準確性提供了保障。項目團隊對上述語料內容進行問題和答案的拆分與精細化處理,得到4400余條問答對,再加上FAQ語料庫二期建設內容中篩選出的6000余條問答對,這些原始語料構成了FAQ語料庫的基礎內容。語料內容主要著眼于國家圖書館資源與服務相關的咨詢問題,同時兼顧國家圖書館業務規范、中圖法及圖書館標準等四個方面的圖情領域知識。
在FAQ語料庫內容的建設標準方面,項目團隊對原始語料進行梳理、分類和整合,建立了標準問題、標準答案和相似問題,三者構成了FAQ語料庫內容的核心要素。在此過程中,項目團隊對三個核心要素的概念進行了初步界定。在技術或客服領域,標準問題主要指常見且有固定解決方案的問題,這些問題的答案通常是預先確定的,可以快速提供給用戶;標準答案是指對于標準問題的最佳實踐解決方案或官方推薦的答復,這些答案經過驗證,能夠解決大多數用戶遇到的問題;相似問題是具有標準問題中關鍵詞的替代詞或者以不同表達方式表達標準問題相同語義的問題,這些問題雖然在細節上有所不同,但它們的核心問題或解決方案是類似的,并且在標準問題對應的標準答案中能夠找到對應答案。相似問題與標準問題之間可以是平行的并列關系,也可以是集合關系。以標準問題“國家圖書館讀者卡的辦理方式”為例,其對應的標準答案中不僅包含線上申辦電子卡和到館申辦實體卡兩種申辦方式,還詳細介紹了兩種方式的申辦年齡、證件要求和申辦流程等細則。該標準問題下,目前包含462個相似問題,包括“可以線上辦證嗎”“能遠程辦理讀者卡嗎”“如何辦理國家圖書館讀者卡”“外籍人士怎么辦卡”“辦理讀者證需要什么證件”“讀書證怎么辦”“外地用戶如何辦理讀者卡”等不同角度的不同問法。
項目團隊對同一問題的不同問法進行歸納,建立統一的標準問題,這些不同問法作為該標準問題下的相似問題,將同一問題的不同問法的答案進行統合,作為該標準問題所對應的標準答案,梳理得到1049個標準問題和3000余個相似問題。隨后,項目團隊對標準問題進行多輪新增、修改、拆分或合并,對相似問題進行泛化、標注和補充,以及修訂和優化標準答案,最終得到1052個標準問題和對應的標準答案,以及近45,000個相似問題。
在FAQ語料庫的內容組織方面,前述四方面的語料內容構成了FAQ語料庫內容架構的一級類目。為了對FAQ語料庫的知識資源進行有效組織、管理和維護,建立較為適用的組織體系至關重要。項目團隊在國家圖書館綜合咨詢服務現有咨詢問題分類體系的基礎上,結合在線咨詢的服務特點,擬定了較詳細的FAQ語料庫的內容組織體系框架(見表1)。其中,屬于讀者高頻咨詢內容的一級類目“國家圖書館資源與服務”是FAQ語料庫內容的主體部分,共包含627個標準問題和標準答案,包括方位指引等11個二級分類;一級類目“業務規范”主要針對國家圖書館各業務模塊相關的業務規范內容,涵蓋324個標準問題,具體包括OPAC規范等7個二級分類;一級類目“圖書館法與圖書館標準”主要涵蓋圖書館法和相關標準規范的概況等內容,包含69個標準問題;一級類目“中圖法”則涵蓋中圖分類法簡介類相關內容。
同時,項目團隊對FAQ語料庫的資源內容開展了細顆粒度的內容標引、關鍵知識點的標簽和標引,以及在存在總分關系的標準問題中添加引用功能,并在相互關聯程度較高的標準問題之間設置了關聯關系等。例如,針對國家圖書館古籍館維修改造情況,所有涉及古籍館服務點的FAQ語料均添加了“古籍館閉館”標簽,便于今后依據情況變化開展修訂工作時能夠快速定位。在FAQ語料庫內容的顆粒度方面,依據讀者咨詢服務具體情況,區分出高頻問題和長尾問題,將高頻問題拆分成較小的顆粒度,長尾問題則保持較大的顆粒度。
2.2 FAQ語料庫的管理與運營
FAQ語料庫在整合梳理及標準化之后,需要設置匹配置信度,進行語料清洗、相似問題的系統泛化生成和人工標注篩選,同時建立多組測試集進行多輪模型訓練和跑批測試,再借助自然語言理解分析功能對測試結果進行人工調優[6]。其中,模型訓練既包括FAQ問答式會話的單引擎調優,也包含FAQ語料庫與文檔語料庫的多引擎聯合調優[7]。
第一,為了確保問答匹配的精準度,系統針對FAQ語料庫承接的問答式會話設置了匹配的置信度。當用戶咨詢問題與FAQ語料庫中某個標準問題或者相似問題的匹配程度達到該置信度時,系統會反饋該標準問題對應的標準答案;反之,則無法匹配。關于置信度的設置標準,如果置信度設置過高,本該由FAQ語料庫承接的讀者服務高頻問題,會因為置信度設置偏高而無法成功匹配,導致FAQ語料庫承接失敗。反之,如果置信度設置偏低,不同標準問題之間以及不同標準問題下對應的相似問題之間會產生混淆,會大大增加后期人工解除纏繞和系統調優的工作量,也會引發大量咨詢問題被FAQ語料庫過度攔截而無法漏給文檔承接的結果。
第二,進行相似問題的泛化和建立測試集。相似問題的泛化,通常從詞語即實體的不同說法和句子的語義相似度兩個層面進行[8]。項目團隊首先為每個標準問題建立6個相似問題,在此基礎上通過系統泛化工具為每個標準問題泛化生成100~130個相似問題,再由人工進行標注和篩選,按照1∶30的比例為每個標準問題篩選出30個相似問題,用來進行FAQ問答模型訓練。同時,人工按照1∶3的比例為每個標準問題標注出3個相似問題,分別生成3組測試集。此外,為了保證測試問題與讀者真實問法最為接近,項目團隊從基于NLP1.0技術的智能問答系統中篩選出讀者服務類咨詢高頻問題相關的日志1000余條,在系統后臺進行標準問題的匹配,生成第4組測試集,以上4組測試集均被用來進行模型驗證。根據測試集跑批測試結果進行調優。系統調優是通過人工的方式,調整標準問題、相似問題與咨詢問題的匹配置信度,實現咨詢問題與FAQ語料庫中的標準問題或相似問題的匹配。在上線前的聯合測試和調優階段,全館各部門參與聯合測試,反饋結果涉及問題承接范圍、匹配準確度及敏感詞等方面,項目團隊進行針對性的人工調優和二次測試,聯合測試階段的調優工作包括添加相似問題和問題模板、修改相似問題、拆分細化標準問題以及按照少量必要的原則增加標準問題。
第三,FAQ語料庫需要根據服務政策等內容的變化進行實時維護和更新。首先,國家圖書館服務政策調整或服務資源的任何變動,都會影響到標準問題、標準答案及相似問題,需要對FAQ語料庫進行實時維護。其次,國家圖書館自建和外購有260多個數據庫,數據庫訪問方式的變化或外購數據庫的增減,致使FAQ語料庫中的標準問題、標準答案及相似問題都需要進行實時維護和修訂。最后,標準答案也需要參考日志分析結果和運行情況不斷優化,以及不斷擴充和調整相似問題,以期得到更精準的咨詢解答和更優的服務效果。
第四,FAQ語料庫的效果反饋和評價,覆蓋FAQ語料庫建設和運營的全過程。在FAQ語料庫建設階段,通過語義診斷可判斷出標準問題之間、不同標準問題對應的相似問題之間存在的纏繞關系,從而進行調優。在系統運營階段,一方面,問答式會話中用戶對咨詢問題解答后反饋的點“贊”和點“踩”,是語料庫建設效果的直接體現,但由于用戶反饋在咨詢總量中占比較小,因此無法反映咨詢效果的全貌;另一方面,項目團隊通過對系統人工智能對話日志分析,全面掌握由FAQ語料庫承接的問答式會話的命中準確率,從而對于命中錯誤或未命中的問題,進行系統分析和調優。
3 大模型賦能的智能問答系統運行情況分析
3.1 日志分析概況
按照讀者問題的承接方式來劃分,智能問答系統人機交互問答日志主要分為FAQ語料庫承接的問答式會話日志和文檔融合大模型功能承接的會話日志兩類。智能問答系統自2024年4月23日上線,至10月31日已穩定運行超過半年,按照導出日志數量統計和分析,系統接收問題共計87,739條。其中,問答式對話52,822條,約占日志總量的60.2%;文檔融合大模型功能承接的會話日志34,074條,約占日志總量的38.8%;涉及敏感詞事件、預置閑聊對話和歡迎語等其他類型咨詢843條,約占日志總量的1.0%。FAQ語料庫承接的問答式對話中,能夠準確命中標準問題的數量是50,836條,約占FAQ語料庫承接量的96.2%。
FAQ語料庫承接的問答式會話中,“進入國家圖書館的證卡要求”“入館需要提前預約嗎”“國家圖書館讀者卡的辦理方式”三個標準問題,占咨詢量前三位。排在前十位的讀者咨詢熱點問題見表2。
3.2 FAQ語料庫命中情況的原因分析及調優策略
借助自然語言理解分析FAQ語料庫承接的問答式會話部分命中錯誤的原因,并針對各類問題制定了有針對性的調優策略。如果是因為應匹配的標準問題下缺少與咨詢問題對應的相似問題,則通過添加相似問題進行調優;如果因咨詢問題語義不明確、表達不完整或存在錯別字導致未能命中,則將讀者咨詢問題補充完整或修正錯別字后添加相似問題;如果因為不同的標準問題對應的相似問題存在混淆,則通過調整對應標準問題下的相似問題的置信度,達到解除纏繞的目的;如果FAQ語料庫中缺少與高頻咨詢問題匹配的標準問題,則根據慎重且少量的原則,添加相應的標準問題、標準答案及相似問題來實現調優。此外,因文檔語料庫包含47家副省級公共圖書館相關語料內容,當讀者咨詢問題未明確主語時,會出現命中其他公共圖書館相關標準問題的情況,則通過系統設定的方式解決,也就是當咨詢問題缺失主語時,默認主語設定為國家圖書館。
除了針對具體幾類問題的調優策略之外,項目團隊還對容易匹配錯誤的咨詢問題,按照類別進行了匯總和梳理,并針對每一類咨詢問題給出了應統一匹配的標準問題,制定了《日志分析工作標準》,為項目團隊的日志分析和調優提供了統一標準,該標準根據日志分析的情況實時更新補充。例如,“注冊”統一指向的標準問題是遠程數字資源訪問入口中讀者門戶的賬戶注冊,而不是讀者卡過期注冊。
4 FAQ語料庫建設的發展策略
4.1 FAQ語料庫的內容優化和來源拓展
在FAQ語料庫建設的內容優化方面,后續應結合將要實施的優化綜合咨詢臺等服務策略進行調整,將線下讀者咨詢問題加入語料庫,以及對資源與服務導引類標準問題進行進一步細化和實時更新,同時完成上述語料的數字人個性化語料定制工作。在FAQ語料庫建設的來源方面,除了讀者咨詢檔案、系統問答日志和館內征集語料等途徑之外,還可引入多維度、多渠道的來源[9]。為進一步提升語料庫建設效果和智能問答系統服務效果,國家圖書館與普世通公司合作建設國家圖書館網絡資源采集問答化服務平臺,該平臺是以國家圖書館官網豐富的資源為依托,借助互聯網采集技術與AIGC技術,建立的準確、高效的國家圖書館智能問答服務語料的采集、整理、加工、標注、管理全流程服務平臺。同時,對平臺采集的內容進行數據標注整理工作,形成自有知識產權的語料標注數據集,定義國家圖書館在知識問答領域的標準化標注數據集,助力建設可信任的大模型生態。此外,還可引入眾籌機制,爭取借助圖書館行業專家和從業者的共同關注和支持,豐富和完善FAQ語料庫。在FAQ語料庫的內容組織體系優化方面,隨著FAQ語料庫內容的不斷完善,其內容組織體系方面更為系統化和精細化。宏觀層面可借助知識圖譜將FAQ語料庫的結構化體系進行整體優化。微觀方面可借助標準問題之間的引用功能和關聯問題功能,不斷調整和優化標準問題的總體架構和邏輯關系,補充和完善標準答案;可利用模板構建的功能處理只有單一查詢條件等簡單問題的泛化工作,從而降低人工泛化相似問題的編輯成本。
4.2 FAQ語料庫建設標準的制訂
第一,在標準問題的界定和規范方面,從標準問題的顆粒度來說,雖然將高頻問題和長尾問題作為標準問題顆粒度的建設依據,但對于同為高頻問題的標準問題或標準答案,尚不知其顆粒度如何細化以及細化到什么程度,從而既能確保問題命中的準確度和靶向性,又能規避因標準問題或標準答案內容涵蓋范圍過大或過小對讀者咨詢服務體驗產生的影響,故其建設標準還有待完善,且標準問題之間的邏輯結構及文字表述也需要建立統一的規范。第二,在相似問題的界定和規范方面,需界定相似問題的語義范圍,規避相似問題的語義范圍擴大或者偏移等知識構建方面的問題,確定相似問題泛化的標準和范圍,以及人工對泛化產生的相似問題進行標注和篩選應當遵循什么標準。第三,用于解決纏繞的澄清功能與用于解決泛化并繞過語法解析脆弱性的模板功能等的建設標準和規范需要考慮,例如模板盡量限定較小范圍,避免因為大量添加模板引起標準問題之間的纏繞和混淆。第四,FAQ語料庫問答匹配置信度的參數設置有待進一步商榷。第五,針對同一個標準問題,設置詳細答案和簡明答案等多種答案以實現不同端口調用對應答案類型的FAQ語料集的功能時,語料答案的簡化標準等也需要涉及。上述各方面內容的標準和規范,都需要制定出國際化、通用化的建設標準和規范,并在系統運行實踐中不斷進行優化[10]。
4.3 優化大模型智能化水平,提升咨詢應答能力
FAQ語料庫和大模型賦能的文檔語料庫,作為大模型賦能的國家圖書館智能問答系統兩大語料內容來源和支撐,互為補充、協同發展,以不斷提升咨詢服務應答準確率和服務效果。大模型賦能的智能問答系統的應用,顯著提升了問題解決速率,使得大量常見、簡單的問題能夠迅速得到準確答復,有效減輕了人工服務的壓力,也展現出大模型的語義理解和處理能力。但是,面對更為復雜多樣甚至廣泛、發散的咨詢需求,現有的問答匹配機制也存在定位錯誤、語義無法識別或錯誤理解等問題,這些都對大模型的廣泛知識覆蓋能力、理解復雜語境和精準抽取答案的能力提出了更高要求[11],因此智能問答系統的性能需要不斷進行優化。在底層技術架構的優化方面,須將智能問答服務底層的文心大模型的版本進行迭代升級,以期通過大模型在語義理解、上下文關聯等方面展現出的更強能力,使智能問答系統能夠更深入地洞察用戶意圖,提供更加精確、個性化的回答,從而極大提升系統的智能化水平和服務質量,為用戶帶來更加卓越的問答體驗[12]。
4.4 FAQ語料庫的運維和多渠道復用
系統運維是個長期過程,FAQ語料庫同樣需要持續維護,不僅需要不斷豐富相似問題和持續進行系統調優來擴大其承接范圍,還需根據服務策略調整或服務格局變動而實時進行更新維護和優化完善,以確保語料內容的準確性和實時性。此外,需要推動FAQ語料庫的多模態融合和多渠道復用。未來的智能問答系統既不能局限于文本,又要融合圖像、音頻等多種模態的信息,提高系統的理解和回答能力。同時,通過用戶畫像和歷史交互記錄,智能問答系統需要能夠提供更加個性化的服務以及定制化的多場景復用,提升用戶體驗和服務效能[13-14]。FAQ語料建設是一項系統化且可持續性的工作,為FAQ語料庫的多模態融合和多渠道、多場景的復用提供了保障。例如國家圖書館115周年館慶推出的數字人小圖,其智能語音問詢的后臺語料支撐,就是在大模型賦能的國家圖書館智能問答系統的FAQ語料庫通用答案的基礎上,進行內容簡化和網址鏈接、特殊符號替換和處理后,建設成匹配數字人語音播報場景的定制化特殊語料集。數字人的呈現形式也為語料庫建設賦予了更大的價值,使得語料庫得以更加充分、高效地被利用,進一步提升了智能問答系統的服務質量和用戶體驗。再如,為實現系統建設的優化與整合,在智能問答系統的后續建設中,國家圖書館擬將現有的呼叫中心語音電話服務咨詢平臺納入其中,實現電話接入咨詢、語音播報解答的服務形式,成為FAQ語料復用的又一個場景和渠道。今后,服務場景還可進一步拓展到智能導覽、虛擬講解員、閱讀推廣和特殊群體無障礙服務等方面[15]。
4.5 FAQ語料庫的評價體系建設
雖然目前系統提供“贊”“踩”功能,但是讀者參與度較低,反饋數量極少。因此,還需要進一步拓展評價獲取的廣度,除了前述的用戶反饋和日志分析匹配準確率之外,還應該在答案的精確度、完整性、用戶友好性及情感體驗等方面進行功能性評價[16]。此外,還可邀請業界專家和館員隊伍參與到FAQ語料庫的反饋和糾偏等評價工作中,例如日志分析過程中,館員可對匹配情況進行打分,對匹配錯誤的問題進行登記、反饋、干預和調優糾偏,不斷提升用戶體驗。
4.6 FAQ語料庫的團隊建設與人才培養
基于大模型技術的智能問答系統的FAQ語料庫建設工作,無論是總體梳理和標準化,還是語義診斷及測試集調優環節,對項目人員全面掌握圖書館綜合咨詢服務規范和溝通話術等服務策略,及對其人工智能相關知識的快速學習和掌握能力,都提出了更高的要求[17]。現階段,圖書館行業中人工智能相關專業的人才還相對不足,尤其是缺乏同時掌握圖書館業務技能和人工智能技術的復合型人才,難以滿足圖書館向人工智能等技術應用的智慧化轉型[18]。圖書館應通過人才培養和業務培訓,逐步提升館員綜合素質,建立包括數據館員、人工智能標注師、人工智能訓練師、數據分析師等專業人才在內的新型人才隊伍,為圖書館向智慧化轉型提供人才保障。
5 結語
大模型具備強大的語言理解和生成能力,其廣泛應用為智能問答系統帶來了革命性的變化,顯著提升了問答系統的性能和用戶體驗。FAQ語料庫作為智能問答系統的重要語料支撐之一,具有答案可靠性和可控性的優勢,在現階段智能問答系統語料建設中占據重要地位。今后,隨著大模型技術的不斷發展,系統的理解和生成能力不斷提升,生成式回答更加自然流暢,“幻覺”比率不斷下降,FAQ語料庫與大模型賦能的文檔語料庫不斷融合,實現圖書館各類服務系統的互聯互通。以智能問答系統為切入口,為用戶提供書目檢索結果反饋、圖書借閱及在借圖書查詢、復印服務請求、咨詢委托提交、展覽講座預約等各類讀者服務為一體的一站式服務,實現以智能問答系統為代表的圖書館智慧化服務轉型,使得大模型和AIGC技術在圖書館這一垂直行業領域的應用實現更深層次的發展,將為用戶提供更加優質的服務體驗[19]。
參考文獻:
[1]張煒,高馨.公共圖書館人工智能應用現狀與發展策略研究[J].國家圖書館學刊,2023,32(5):75-83.
[2]李佳軒,儲節旺,杜秀秀.關聯、黑箱與賦能:AIGC驅動智慧圖書館的轉型路徑[J].圖書情報工作,2023,67(23):18-27.
[3]李書寧,劉一鳴.ChatGPT類智能對話工具興起對圖書館行業的機遇與挑戰[J].圖書館論壇,2023,43(5):104-110.
[4]曹寧,楊倩.面向智慧圖書館的參考咨詢服務發展思路初探[J].國家圖書館學刊,2022,31(3):22-28.
[5]王磊.新媒體環境下的圖書館參考咨詢服務:以國家圖書館為例[J].國家圖書館學刊,2012,21(5):96-101.
[6]王靜靜,葉鷹,王婉茹.ChatGPT類AI GPT技術應用對圖書館信息處理的變革探析[J].圖書館理論與實踐,2024(1):122-127,136.
[7]孫凱麗,羅旭東,羅有容.預訓練語言模型的應用綜述[J].計算機科學,2023,50(1):176-184.
[8]王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應用[M].北京:電子工業出版社,2020:386-398.
[9]余望枝,劉芳.基于智能問答的圖書館參考咨詢服務設計及優化[J].圖書館理論與實踐,2024(1):128-136.
[10]CHOW L,SAJONAS S.From UX study to UX service: using people centered research methods to improve the public library experience[J].Public library quarterly,2020,39(6):493-509.
[11]馮小桓.挑戰與前景:ChatGPT在圖書館智能客服系統中的效能和應用[J].圖書館理論與實踐,2024(3):111-116.
[12]孫鵬,王宇,劉新勇.ChatGPT賦能圖書館:現實基礎、邏輯方向與應用場景[J].情報資料工作,2024,45(5):100-106.
[13]趙楊,張雪,范圣悅.AIGC驅動的智慧圖書館轉型:框架、路徑與挑戰[J].情報理論與實踐,2023,46(7):9-16.
[14]張強,高穎,趙逸淳,等.ChatGPT在智慧圖書館建設中的機遇與挑戰[J].圖書館理論與實踐,2023(6):116-122.
[15]司莉,馬小景.元宇宙視角下虛擬數字人賦能圖書館用戶服務研究[J].圖書館建設,2023(6):62-68.
[16]宋靈超,李紅鋼,靜發沖.基于服務反饋機制的圖書館智能咨詢系統的構建和應用:南開大學案例研究[J].圖書館雜志,2023,42(6):56-67.
[17]蔡迎春.賦能與重塑:智慧服務下館員培訓體系再思考[J].國家圖書館學刊,2021,30(3):34-41.
[18]郭亞軍,龐義偉,周家華,等.ChatGPT賦能圖書館虛擬數字人:技術優勢、應用場景與實踐路徑[J].圖書館論壇,2024,44(8):69-79.
[19]劉煒.智慧圖書館十問[J].圖書館理論與實踐,2022(3):1-6.
作者簡介:
翟蓉(1981— ),女,碩士,副研究館員,國家圖書館參考咨詢部綜合咨詢服務組組長。研究方向:圖書館用戶與信息服務、智慧圖書館。