
摘 要:人工智能和大模型是當今世界最重要的技術之一,是國家在科技自立自強領域取勝的關鍵賽道。高校作為科技創新的重要力量之一,也都在加強對人工智能和大模型的研究和建設。文章探討了大模型和圖書館相結合的發展趨勢、技術架構和應用場景,對圖書館大模型的落地實施和安全問題進行了探索,通過對圖書館大模型的全面剖析更好地理解大模型對社會、經濟、科學等多個領域的深遠影響,并提出了圖書館大模型的應對策略。
關鍵詞:人工智能;大模型;圖書館;科技創新;智能化
中圖分類號:G258.6 文獻標識碼:A 文章編號:1003-1588(2024)11-0087-04
1 背景
人工智能(AI)是推動數字經濟發展的核心技術,大模型是人工智能的基礎,在語言理解、圖像識別、自動駕駛等領域應用廣泛[1,2]。大模型采用深度學習技術,通過數十億甚至數萬億參數的網絡結構,模擬人腦的復雜神經網絡,實現對龐大數據集的高效學習與推理,大模型是“大數據+大算力+強算法”結合的產物。在金融領域,大模型被應用于風險管理、個性化金融服務和反欺詐,以提高風險評估的準確性和客戶滿hk5vYMscGuW/nVSrk6S8Sg==意度,保障資金安全;在醫療領域,大模型助力醫學影像診斷、老年患者管理和醫學研究,提高診斷精度、個性化醫療和新藥研發效率;在制造領域,大模型實現了智能化生產計劃、優化質量管理和預測設備故障,提高生產計劃的準確性、產品質量和設備可靠性。大模型的迅猛發展也伴隨一系列挑戰和問題,如數據隱私、算法公正性、技術透明性等。
圖書館作為高校的重要服務窗口,如何借助大模型的能力為廣大師生提供更好的服務,是擺在館員面前的重要問題。本研究結合中國傳媒大學圖書館的業務特色,從需求分析、模型構建、實施落地、模型安全等維度,提出了圖書館大模型的構建策略。
2 圖書館大模型目標
中國傳媒大學圖書館設置綜合辦公室、資源建設部、學科服務部、空間及技術保障部、借閱服務部、特藏建設部等六個部門。圖書館以讀者需求為導向、以學科建設為引領,資源建設和空間建設雙核驅動,使資源建設特色更鮮明、用戶服務保障更智能、服務學科建設更精準、技術體系保障更有力、學習空間塑造更人文、館員隊伍建設更專業[3,4]。但是,圖書館在信息化和智能化方面仍有待提升,檢索系統的便捷性和標準化程度不高,現有系統缺乏高效的智能推薦和個性化定制功能;缺乏大模型等智能化工具,深度學習和數據挖掘技術的普及度不高,難以實現對用戶行為和需求的精準分析和個性化服務[5-7]。
圖書館利用大模型技術可實現自動化的文件管理和信息整合,提高辦公效率;開發智能助手系統,為工作人員提供信息查詢、日程安排等服務;對圖書館館藏進行深度挖掘和分析,發現館藏的潛在價值和研究熱點,開發智能化的圖書推薦系統;開展學科文獻分析和知識發現,為研究者提供更全面的學科服務支持;開發基于大模型的學科問答系統,為用戶提供學科咨詢和解答服務;進行數字化館藏建設,實現對文獻的自動掃描、數字化處理和元數據錄入;對圖書館空間進行優化,提出空間布局和服務改進建議;開發圖書館空間導航系統。
圖書館大模型應用的總體架構主要包括兩類,分別為“智慧圖書館+大模型”和“大模型+智慧圖書館”。“智慧圖書館+大模型”是圍繞圖書館業務嵌入大模型技術,以圖書館業務場景為核心,面向館員打造大模型應用場景。“大模型+智慧圖書館”則是以圖書館大模型為核心,調用知識庫等外部系統提高智能處理和認知推理能力,面向讀者打造統一服務入口,提供咨詢問答、檢索推薦、新型閱讀等多元服務。圖書館大模型正在由“+大模型”向“大模型+”范式轉變[8,9]。
3 圖書館大模型構建
3.1 總體架構
圖書館大模型架構設計涉及數據、算法和算力,底層要有基礎的大模型,往上建設傳媒大模型。傳媒大模型往上迭代圖書館大模型的應用層,圖書館大模型的三層總體架構見圖1。底層的通用大模型通過選擇業界的主流產品可獲得,中間的傳媒大模型通過加入圖書館數據進行模型微調,上層的落地場景滿足了圖書館實現智能化應用的目標。
3.2 應用場景
3.2.1 信息咨詢智能問答。智能問答系統主要通過對大量文獻數據、圖書館服務相關信息的學習和分析,建立龐大而完備的知識庫。系統能夠利用先進的自然語言處理技術,對問題進行理解和分析,并從知識庫中找到最匹配的答案。
3.2.2 圖書館智能導航。圖書館通過對館藏信息、服務流程、空間布局等進行全面的數據整合和分析,構建完整而豐富的圖書館知識庫,對用戶提出的導航請求進行深度理解和分析,準確識別用戶需求,并給出相應的導航方案,如:圖書館根據用戶的學科背景、研究興趣等因素,為用戶推薦相關的書籍、期刊和數據庫資源。系統能夠提供多維度的導航服務,包括空間導航、資源導航、服務導航等,用戶可以通過系統快速定位所需資源的位置,了解相關的服務信息和使用規則;圖書館能夠及時更新最新信息和變化,保持導航數據的準確性和實用性,用戶可以隨時通過系統獲取最新的館藏信息、活動通知等。
3.2.3 圖書館館藏智能檢索。圖書館能夠通過對館藏、學術文獻、服務流程等大量數據的分析和處理,結合用戶的查詢需求和偏好,實現智能化的信息檢索和推薦功能,主要包括數據采集、數據處理、信息檢索和結果展示等。圖書館要收集和整理的各類資源數據包括圖書、期刊、論文、數據庫等,對采集到的數據進行處理,提取其中的關鍵信息和特征,建立索引和詞典等數據結構,以便后續的檢索和查詢操作。
3.2.4 圖書館數字館員。數字館員對館藏資源進行全面、精準的管理,能夠實現對館藏的智能化分類、標注、整理和更新,使圖書館的資源管理更加高效、準確。數字館員可以對用戶的需求和興趣進行深度分析,為用戶提供個性化的信息推薦、學術指導、參考咨詢等服務。數字館員可以為用戶解答相關問題,解決用戶在使用圖書館資源過程中遇到的各種問題。數字館員參與圖書館的運營決策和管理,為圖書館管理者提供決策支持,幫助其更好地了解用戶需求,優化資源配置,改進服務流程。
3.2.5 圖書館學科服務。學科服務是指為不同學科領域的用戶提供個性化、智能化的服務支持,滿足其在學術研究、教學和學習過程中的信息需求和知識獲取需求,涵蓋了對學科資源的整合、學科專業化服務的提供、學科研究支持等。學科服務可以對圖書館的學科資源進行全面、精準的整合和管理,能夠實現對學科領域的學術期刊、學位論文、專著、研究報告等各類資源的智能化分類、標注、整理和更新;對學科領域的研究熱點、前沿動態等進行實時監測和分析,為學科研究者提供學科趨勢分析、文獻檢索、學術交流等支持,促進學科研究的開展和成果的交流。學科服務系統可以為教師和學生提供豐富多樣的學科教學資源、課程輔助資料、學科學習指導等服務。
3.2.6 圖書館智能答疑。圖書館要整合各類資源和服務信息,實現智能化的問題解答和服務支持,深入理解用戶提問的含義,識別其中的關鍵詞和信息,更準確地理解用戶的需求。圖書館要結合資源和服務信息,為用戶提供豐富、準確的答案和解決方案;通過搜索圖書館館藏、學術文獻、數據庫等資源,找到與用戶提問相關的答案,并根據其相關度和權威性進行排序和推薦。
3.2.7 館藏好書速讀。圖書館要幫助用戶在繁雜的信息中快速找到優質的讀物,分析用戶的閱讀歷史、偏好和興趣,智能推薦契合用戶需求的優質讀物:一是快速瀏覽,通過對文本內容的摘要、關鍵詞提取和重點標注,幫助用戶快速把握文章的核心內容和要點。二是智能摘要,自動生成文章的精煉摘要,為用戶提供閱讀參考。摘要不僅能夠準確概括文章的主要內容,還能突出文章的重點和亮點。三是關鍵詞標注,對文章進行關鍵詞標注,將文章中的重要術語、名詞和短語進行標注和解釋,幫助用戶理解文章的專業術語和概念。四是個性化定制,根據用戶的閱讀偏好和需求,設置閱讀速度、閱讀模式、關注領域等參數,定制個性化的閱讀體驗,并根據用戶的反饋和行為數據,不斷優化推薦算法和閱讀體驗。五是學習記錄和評估,記錄用戶的閱讀歷史和行為數據,分析用戶的閱讀習慣和興趣偏好,提供個性化的學習建議和評估。
3.2.8 圖書館書友圈。圖書館可結合人工智能技術與圖書館資源的社交平臺,為讀者提供交流、分享和學習的場所;分析用戶的閱讀歷史、興趣偏好等數據,為用戶推薦個性化的閱讀書單;書目推薦不僅要基于用戶過去的閱讀行為,還要考慮圖書館館藏、熱門書籍和學術資源等因素,為用戶提供更加精準、多樣化的閱讀建議。
4 圖書館大模型實施
4.1 通用大模型選型
在圖書館大模型實施階段,通用大模型的選型至關重要,直接關系到智能化平臺的效率、可行性和長期可維護性。首先,圖書館需要考慮館藏的規模和類型、用戶的使用模式、數字資源的多樣性等;其次,圖書館要兼顧現有的系統,如數字圖書館系統(DLS)和智能化資源管理系統(DRMS)的現狀和對接條件等。
大模型算力準備直接關系到智能化過程的質量、效率和可持續性。除常規的GPU、CPU等計算資源外,存儲設備的選擇也極為重要,選擇高容量、高性能的存儲設備安全有效地保存數據資源,涉及服務器、網絡存儲設備或云存儲解決方案的選用。云存儲的優勢在于能夠提供靈活的存儲空間,使用戶能夠在不同地點、不同設備上訪問智能化資源。
4.2 圖書館大模型數據
圖書館的結構化數據較多,要利用知識圖譜(Knowledge Graph)進行知識表達和處理,并和大模型進行配合使用,賦能圖書館的智能化服務。知識圖譜采用實體、屬性、關系三元組構建知識,尤其適合圖書館結構化的數據處理,是知識表達的重要方式,可以和大模型結合使用,即用知識圖譜構建的數據是圖書館大模型的數據輸入源之一[10]。在構建方案中,圖書館梳理好業務知識圖譜后,抽離現實世界中的實體與實體、實體與屬性之間的關系,通過三元體結構進行表達,構建完成圖譜概念樹、概念屬性及關系管理。圖譜關系構建完成后,圖書館可添加實體數據,大模型提供不同數據的處理方式;對于結構化數據通過知識映射快速導入數據,支持用戶手動創建導入;對于非結構化數據提供閱讀理解模型,可抽取非結構化數據中的實體、關系及實體屬性值。
5 圖書館大模型推廣價值
首先是提高資源的可訪問性,將館藏文獻轉化為數字形式,拓展用戶獲取信息的途徑,為讀者、研究者、學生等提供便捷和廣泛的獲取途徑。圖書館大模型將文獻資源從實體形態轉化為數字形態,使用戶能夠利用先進的搜索引擎和檢索工具,高效定位所需信息;提高檢索效率,為用戶提供更豐富的信息資源,包括文本、圖像、音頻等多媒體形式。其次是推動信息共享和協作。圖書館大模型重新定義了圖書館的角色,促進不同機構、學者和社群之間更廣泛、更深入的合作,構建知識共享網絡;使圖書館成為信息樞紐,為用戶提供一個共享和交流的空間;為圖書館構建了開放的知識共享平臺,通過數字資源的開放獲取和共享促進了全球范圍內的學術合作。再次是個性化服務和學習支持。圖書館大模型為用戶提供了更全面、即時的學術咨詢和指導,用戶可以通過數字平臺獲取包括文獻檢索、學術寫作、數據分析等個性化學術支持,成為學術生涯中不可或缺的智能化學術伙伴。
參考文獻:
[1] 梁迎麗,張夢夢.AI大模型推動教育發展的理論訴求與實踐路徑[J/OL].南京郵電大學學報(社會科學版),1-6[2024-03-21].https://doi.org/10.14132/j.cnki.nysk.20240321.001.
[2] 鄔賀銓.大模型融入云平臺,信息化走向數智化[J].重慶郵電大學學報(自然科學版),2024(1):1-8.
[3] 武林娜,宋愷,王淞鶴.生成式人工智能對個人信息安全的挑戰及應對策略[J].信息通信技術與政策,2024(1):13-18.
[4] 洪永淼,汪壽陽.ChatGPT與大模型將對經濟學研究范式產生什么影響[J].計量經濟學報,2024(1):1-25.
[5] 盧仕嚴.圖書館智能化的規劃、目標和實現[J].圖書館學研究,2000(5):43-45.
[6] 馬慧萍.圖書館的智能化研究:我國智慧圖書館標準體系構建探討[J].科學咨詢(科技·管理),2020(2):66-67.
[7] 賈君枝,張貴香.智慧圖書館建設視角下館員元數據核心能力構建[J/OL].中國圖書館學報,1-16[2024-03-21].http://kns.cnki.net/kcms/detail/11.2746.G2.20240311.1832.006.html.
[8] 楊曉雯.ChatGPT驅動下的圖書館變革:構建智慧圖書館的新路徑[J].大學圖書情報學刊,2024(2):46-52,89.
[9] 杜艷艷.數字化轉型背景下智慧圖書館產品的價值意蘊、實踐邏輯和推進路徑[J/OL].圖書館,1-7[2024-03-21].http://kns.cnki.net/kcms/detail/43.1031.G2.20240208.2122.004.html.
[10] 王娟,曹樹金,王志紅,等.面向探索式搜索的領域知識圖譜構建及實驗探索[J].圖書情報工作,2024(3):105-116.
(編校:崔萌)