羅 飛 崔 濱 辛小江 郭云鵬
(1.重慶財經職業學院 重慶 402160)
(2.重慶三峽學院圖書館 重慶 404199)
新一代人工智能革命浪潮中“GPT-4”①“GPT-4”是OpenAI 公司當前投入應用的最先進的系統,具備廣泛的通用知識和解決問題的能力,能夠產生創造性和技術性寫作任務,實現更安全的有效響應。、“文心一言”②“文心一言”是百度全新一代的知識增強大語言模型,能夠與人對話互動、協助創作、高效便捷地幫助人們獲取信息、知識和靈感。、“通義千問”③“通義千問”是一個包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等在內的超大規模語言模型。等通過特定形式封裝應用的大語言模型產品④大語言模型(Large Language Model, LLM)是用深度學習算法理解和處理自然語言的基礎機器學習模型,可以依據從海量數據集中獲得的知識來識別、總結、翻譯、預測和生成文本和其他內容。展現出優質的智慧涌現能力、信息聚合適應能力、多任務高效處理能力與思維鏈交互能力,能夠基于適當提示(Prompt)自主完成內容創建、機器翻譯、代碼編寫等復雜的通用任務,助力智慧圖書館的知識采集、組織、推理、存儲、傳播與學習等全生命周期中精準生成多維知識關聯與融合架構,推動全球知識生態環境的持續革新。基于大語言模型的多模態知識服務在滿足廣大讀者個性化知識需求并為圖書館員提供智能化輔助工具的同時,逐漸暴露出技術風險、安全風險、隱私侵權風險、版權保護風險以及違反政策法規與道德倫理等復合風險,亟待在價值對齊的基礎上構建安全驅動的嵌入模式、增強技術防御與質量評價能力、完善政策法規監管機制與自律規則以及提升館內工作人員的智慧服務意識與職業技能等。
20 世紀中葉以來,伴隨著復雜來源的研究力量前赴后繼地投入開發能夠理解并掌握自然語言的人工智能技術的多元化科學創新,意圖精準勾勒自然語言概率分布的語言模型(Language Model,LM)經歷了統計語言模型、神經語言模型、預訓練語言模型直至大規模語言模型的迭代發展。
語言是人類文明傳承的基石,“是一種實踐的、既為別人存在因而也為我自身而存在的、現實的意識。語言也和意識一樣,只是出于需要,由于和他人交往的迫切需要才產生的”[1]。從狄俄尼索斯·特拉克斯的《讀寫技巧》①古希臘學者狄俄尼索斯·特拉克斯撰寫的《讀寫技巧》是西方第一部語法著作。到馬建忠的《馬氏文通》②馬建忠創作的《馬氏文通》是中國第一部體系完整的語法著作。,眾多語言學家和人類學家嘗試使用各種句法模板表達語言習慣,卻難以跟上復雜多變的人類語言演化節奏,無法充分發揮語言作為社交工具的最大效用。
隨著人工智能技術的多維發展與多向輻射,旨在讓機器像人類一樣理解語言的自然語言處理成為人機通信方法研究的核心領域,關涉計算機科學的語言模型隨之出現在人類族群重建“巴別塔”的集智通路之上。起初,依托語料數據庫計算歷史單詞序列以估算概率的統計語言模型被廣泛應用到語音識別、機器翻譯、信息檢索等諸多領域,卻難以適應對模型搭建所需歷史單詞數量的指數級增長與龐大的訓練語料無法覆蓋無窮變化的語法等棘手問題。隨著神經網絡發展而逐步成熟的前饋神經網絡語言模型、循環神經網絡語言模型和長短期記憶循環神經網絡語言模型等能夠有效建立長距離上下文之間的依賴關系,大幅提升傳統語言模型的性能,卻無法克服所需模型參數龐大與數據稀疏等弊端。
2017 年12 月,谷歌公司發布了基于注意力機制的Transformer 算法,導致眾多深度學習模型的參數量級突破億級,進而啟發出“BERT”和“GPT-1”等預訓練語言模型。“BERT”是通過掩碼機制挖掘上下文豐富語義的編碼預訓練模型(Encoder-only Pre-trained Models,EPM),雖然在語言理解任務上表現出全局可見的卓越性能,卻因為無法進行可變長度生成而難以應用于生成任務。“GPT-1”是通過自回歸序列生成預測下文的解碼預訓練模型(Decoder-only Pretrained Models,DPM),雖然能夠完成生成任務,卻因為信息單向流動而缺乏上下文交互且需要海量無標注文本數據。因之,主推“BERT”路線的谷歌公司又發布了持續進行參數微調的“BART”,即通過雙向編碼器提取輸入的有用數據以輔助和約束單向自回歸解碼器生成的編解碼預訓練模型(Encoder-Decoder Pre-trained Models,EDPM)。OpenAI 公司一直堅持“GPT”路線,通過擴大語言模型的規模顯著提高零樣本(Zero-shot)與小樣本(Few-shot)學習的能力。“GPT”系列自回歸語言模型的優越性能伴隨著訓練數據與模型參數增長而逐步顯現。如“GPT-3”(1750 億參數)涌現出遠勝于“GPT-2”(15 億參數)的上下文學習能力和多步推理能力,“GPT-4”(1.8 萬億參數)更是在視覺輸入、創造性思維、上下文處理等多種能力測試中達到人類頂級水平,在一定程度上為通用人工智能(Artificial Generative Intelligence,AGI)愿景落地奠定了良好基礎。
大規模語言模型表現出通用性、可釋性、泛化性、靈活性與實用性等基本特征,能夠良好嵌入新型數據且自主完成多個任務,為解決數智應用中開發成本過高且運行效率低下等問題提供可行的解決思路。事實上,推進跨域智慧融合的大語言模型產品不僅遵循基本的縮放法則,亦在多步驟的復雜任務中表現出強大的涌現能力,逐步發展為生產、保存、管理和傳播知識的重要范式,促進人類生產力工具的顛覆性變革。
1.2.1 遵循縮放法則
全球專家學者在基于Transformer 結構開發各類語言模型的過程中反復證實數據量、參數量、計算量與模型性能之間的縮放法則。即隨著模型參數量、參與訓練的數據量以及訓練過程中累積計算量的指數性增大,模型效果越來越好[2]。由于擁有海量參數與復雜層級的大語言模型在數據定義、管理、修正等重要環節的任務表現隨著數據放大與參數更新而愈加突出,主要開發機構持續提升模型的參數極值,如“BERT”的參數為3 億、“Gopher”為2800 億、“GPT-4”達到萬億級別、“通義千問”的參數量甚至超過10萬億[3]。
1.2.2 具備涌現能力
涌現能力①不同學科獨特的解釋角度與方式導致涌現能力擁有多重定義,如物理學將涌現能力定義為一種系統量變導致行為質變的現象。大規模語言模型的涌現能力可以分為基于普通提示的涌現能力和基于增強提示的涌現能力。(Emergent Ability)是通用人工智能照進現實世界的一縷曙光,意味著在一些多步驟的復雜任務中當模型規模超過某個臨界閾值之時,任務效果會出現爆發式增長。不同于傳統業務場景中使用明確代碼表達程序執行邏輯的任務方式,具備涌現能力的大語言模型能夠在不更新參數的情況下,只需在輸入少量帶有標注的數據之后表達預期目標,生成式模型就可以自行找出解決方法。
1.2.3 推進跨域融合
大語言模型固有的泛化性和通用性使其可以跨域融合數據資源并快速抽取生成個性化和定制化的多場景部署應用,助力構建安全高效且低成本賦能各行各業的覆蓋算力、平臺、模型等多維度的生態圖譜。如百度公司在構建“昆侖芯+飛漿平臺+文心大模型+行業應用”完整布局的基礎上,發布了知識增強大語言模型產品“文心一言”和企業級產品“文心千帆”,為多個行業提供應用程序接口和開發工具鏈;又如,華為公司打造了“昇騰芯片+MindSpore 框架+盤古大模型+行業應用”的完整生態體系,主要面向企業用戶提供全棧服務;再如,OpenAI 公司通過插件系統與開發者定義的應用程序接口實現互動,將“ChatGPT”連接到第三方應用程序并執行在線檢索、文檔處理、投資建議等多種場景任務。
迅速崛起的大語言模型為圖書館知識服務的內容優化、功能拓展與模式創新提供了先進的技術支撐,通過強大的數據分析、運算處理與情感反饋等助力深度挖掘讀者的行為規律、需求特征與情感鏈接,“推動了圖書館知識服務從數據分析和可視化向數字內容孿生和數字內容創作地轉變,解決了元數據管理和統一資源服務問題,以更高的效率為讀者提供智慧服務與良好體驗”[4]。
傳統圖書館主要依靠專職館員和志愿人員等開展知識服務,在信息資源加工整理、保存管理與整合提供等方面因缺乏人力、物力與技術能力而在先進性、及時性、便捷性、精準性等方面暴露出諸多問題。圖書館行業中早期的人工智能與數字化操作局限于機械復制或整理必要信息,對讀者需求的吸收、轉化、決策、落實、輸出的整個過程仍然由人工掌握,機器僅發揮著排除失誤或減少重復勞動的功效[5]。例如,高校圖書館一般通過人工調查、計算機檢索和館際知識聯系,收集整理并定期核查知識資源,顯示出耗時長、人力多、成效低且錯誤率高等弊端[6]。
隨著物聯網、區塊鏈、人工智能、元宇宙等新一代信息技術高速發展,融合人的智慧與物的智能的智慧圖書館(Smart Library)通過對“物”的智能改造和對“人”的智慧發揮,形成萬物互聯、智能高效的智慧服務環境,激發廣大讀者駕馭知識、運用知識和創新知識的能力,更注重轉“知”成“慧”的過程,更傾向于知識的轉化和增值[7],呈現出服務理念人性化、服務空間智能化、服務平臺共享化、服務內容知識化、服務類型多元化、服務效益最大化等特征[8]。
基于注意力機制的大語言模型采用機器主導型的運作模式,具有自主捕獲圖書館知識服務抽象特征的能力和較強的邏輯推理能力,能夠在自行分析虛實交互的復雜服務情境的基礎上,精準識別廣大讀者的知識需求與情緒意圖,自主挖掘符號化知識資源并進行類腦推理和自我優化,通過持續多輪的生成式對話互動支撐大規模的跨域知識體驗,助力構建面向廣大讀者的自然直觀的人機共生知識共享與協同服務機制,擺脫人為控制對數字服務的干擾,大幅提升個性化知識服務的智慧水平、沉浸狀態、開放程度與服務質量,確保快速高效地處理知識資源和服務決策中的變量因素,重塑符合圖書館文化特征的知識組織、知識生成、知識應用的多模態復雜場景,充分活躍服務對象的創造思維,推動無紙化工作改革,逐步形成兼顧知識服務主要參與群體的智慧化知識圖譜,生動直觀地促進圖書館與廣大讀者之間的多元交互。
當代圖書館的資料端、服務端、技術端和交流端嵌入大語言模型遵循理性推演、泛化可釋、靈活實用與智慧涌現的運作機理,在收集整合知識資源、集中搭建知識平臺、加強知識交互與拓展知識傳播以及更新維護館內設施與運營方式、促進館際交流與管理理念變革、優化館員招聘與技術培訓等行為領域發揮重要作用。
大語言模型產品持續嵌入自動創建的知識管理框架、優化知識服務全流程的智慧決策支持、完整理解知識創新的方式方法、合理預測知識關聯行業趨勢以及采用更為明確的知識共享專題庫建設策略等提升圖書館知識服務的質量與精度,通過低成本分析廣大讀者的行為數據為創建個性化的知識服務結構體系提供智慧建議。如基于大語言模型建立讀者需求為主導的智能化交互服務范式,理解讀者意愿、提高快速響應質量并提供復雜的融合信息,助力提升讀者群體的信任度、忠誠度與參與指數;又如,大語言模型產品能夠助力圖書館構建智慧化的知識內容集成倉儲、實現多態數字資源的關聯整合與智能化的編目管理,輔助提升圖書館的閱讀推廣、文獻推薦和活動策劃中的文字編輯、數據分析和圖像識別等日常工作任務的質量與效率;再如,“大語言模型微調+本地知識庫”的結合方案在圖書館參考咨詢服務的應用實踐顯示,“充分利用大語言模型智能性的同時規范其自由生成能力,回答問題不僅更具有人性化而且符合具體規定……采用支持量化技術的ChatGLM-6B 模型,在消費級顯卡上即可部署,并采用倒排索引提升系統召回效率,具有實際應用的可行性”[9]。
大語言模型通過分析讀者查詢需求、預測學科咨詢需求、完善智能參考咨詢機制、建立館藏數字孿生復刻空間、評估審核多維資源和多樣服務使用情況等,推進知識資源開放生成、支撐知識管理有序發展、拓寬知識服務的廣度與深度,提升廣大讀者的高度智能體驗、全面感知體驗、虛實交互體驗[10],卻也在嵌入圖書館知識資源的采集、挖掘、集成、共享與重組的完整過程中逐漸在全棧技術、隱私安全、版權保護、道德倫理與政策法規等領域暴露出諸多風險。
大語言模型應用于圖書館知識服務場景需要大規模的數據基礎、高載荷的算力硬件和持續優化的算法模型且相應的數據訓練服務器的有序運轉有賴高速穩定的網絡支撐,由此要求圖書館具備較好的算力基礎設施工程化運營能力、底層系統優化能力、算法設計部署能力、模型訓練和推理能力以及軟硬件服務運維與故障排查能力等。同時,生成式智慧知識服務模式與涉及多學科的多模態模型結構等要求館內工作人員具備較高的技術意識與業務能力。這一切導致大語言模型嵌入圖書館知識挖掘、關聯、分析和使用的全生命周期里充斥著不穩定和不可解釋的全棧技術風險。如圖書館生成式對話交互服務機器人通過捕捉上下文內容的依賴關系掌握精準語言表達的訓練過程中自主生成的符合人類習慣的語言描述與統計邏輯的輸出內容有可能是自主捏造的虛擬信息,甚至是在情境對話中以輸出邏輯混亂的錯誤事實或危險內容為目標進行惡意引導的負向產物。事實上,大語言模型的廣域應用中頻發“機器幻覺”事件①機器幻覺(人工智能幻覺,AI Hallucination)指人工智能自信地給出不符合事實或是毫無意義的回答。,如“ChatGPT”炮制杭州取消限行的假新 聞[11]、“通義千問”將魯智深加入《西游記》取經團隊[12]等;又如,大語言模型綜合依托概率理論完成多級任務導致輸出內容往往是主流觀點,有可能加劇信息繭房現象[13]。廣大用戶在使用傳統圖書館知識服務時必經的信息檢索過程是加強批判性思考、完善自主知識體系的重要環節。基于海量已有信息完成結果響應的大語言模型以“事實”輸出的方式影響用戶判斷,可能會構筑危險的開放式囹圄;再如,雖然大語言模型應用于圖書館知識服務全流程的技術審核通常采用“機器+人工”的雙重審核方式,但實踐中受到多重因素干擾的機器審核呈現出較大的漏報和誤報風險,人工審核中不達標的管理機制、業務流程或職業技能等亦增加虛假信息或違規輸出風險。
智慧圖書館建設完善過程中泛化應用大語言模型面臨著倫理道德與政策法規風險。雖然“ChatGPT”“Bard”“Claude2”等承諾提供“有用、無害和誠實”的合乎道德要求的用戶體驗[14],卻陸續在自主順應人類思維邏輯開展多意圖的多輪對話中暴露出通過對抗式提示繞過開發者設定的防御措施以生成無限量的虛假信息或危險言論等當前難以修復的重大漏洞[15],甚至能夠通過與特定讀者進一步的交互對話逐步說服對方相信這些虛假信息或危險言論,使得尊重自主、公平正義、可持續發展等基本倫理準則處于高風險狀態。例如,推特用戶對ChatGPT 最初版本的編碼測試顯示,該系統具有明顯的種族歧視和性別偏見并持續嵌入自主輸出的文本內容與代碼建議等等。暗網市場上銷售“火爆”的“FraudGPT”“WormGPT”等生成式網絡犯罪輔助工具功能強大且操作簡單,能夠協助尋找受害目標、生成惡意鏈接或釣魚網站、編寫欺詐文書等[16],大幅降低了違法犯罪的門檻,進一步引發人類社會對于大語言模型應用潛藏倫理道德與政策法規風險的憂思。同時,基于大語言模型的智能交互工具嵌入智慧圖書館的知識生成、知識管理、知識傳播等重要階段必然面對基數龐大且來源復雜的讀者群體,往往忽略讀者的不同背景與敏感的文化狀況,在算法設計、數據選擇、模型優化以及服務提供中可能產生多樣化的偏見歧視,甚至傳播嚴重違反倫理道德和政策法規的虛假、色情、暴力等有害信息,導致難以進行有效溝通合作的艱難局面。
圖書館知識服務智慧化建設的重要前提是融入超大規模的高質量數據,相關產品的訓練效率和輸出效果直接受到數據數量與數據質量的重大影響。但是,采用無監督學習方法自大規模語料庫中歸納相應規律并理解生成自然語言文本的知識訓練中使用的未標注數據資料在真實性、準確性與流暢性等多方面存在安全風險。基于語義理解的互動問答和上下文分析捕捉讀者查詢意圖,進而提升知識搜索服務的效率和質量的實踐活動有可能因為多樣化的文件格式與非文本內容等噪聲問題以及算法、數據、平臺中的技術漏洞和偏見錯漏而遭遇重大安全威脅。黑客攻擊者可能會利用漏洞訪問、篡改或刪除重要信息,甚至影響圖書館正常運行[17]。同時,大語言模型產品在自動處理大規模的復雜來源的不同類型數據以生成書籍、文章和其他資源文獻的過程中可能構成壟斷或不正當競爭。違法犯罪分子通過輸入惡意數據資料誘導大語言模型在多輪對話中輸出各類敏感數據,嚴重侵害廣大讀者的數據隱私權。如智慧圖書館應用的生成式信息服務系統根據讀者的瀏覽閱讀記錄、收藏情況和多輪互動回復中顯示的情感去向識別讀者興趣、行為模式和潛在需求,雖然有助于提升讀者的個性化服務體驗、增強知識服務的趣味性和生動性,卻也有可能導致讀者放松警惕而提供更多的隱私數據,在一定程度上增加了隱私侵權風險。
傳統版權制度立足于“只保護自然人思想的表達,而不保護自然人的思想本身”的“思想表達二分原則”。“GPT-4”和“文心一言”等改變了版權領域的底層創作邏輯,廣泛應用于圖書館知識服務的過程中生成很多知識增值的區別原初作品的信息內容,卻大多屬于缺乏真正的自主創造能力的人機協作重組式內容創新。雖然絕大多數國家和地區認為大語言模型產品是基于事先設定好的算法、規則和模板生成的結果而不賦予版權,卻由于生成式智慧對話系統的類人創作和推理能力以及高昂的開發成本引發新型版權風險。如OpenAI 公司通過GPT 系列使用條款提示用戶巨大的版權風險,要求使用者在法律允許的范圍內對所有輸入和輸出內容負責。我國圖書館知識服務中基于人工智能生成的知識內容可能面臨版權保護風險。亟待完善大語言模型產品應用中訓練數據許可授權機制[18],構筑生成作品關聯版權權益的政策法規保護范式并為版權溯源提供技術支撐和規則保障。
大語言模型嵌入多層次、多維度的智慧圖書館知識服務的全生命周期迫切需要在質量、效率、安全、發展等價值訴求中取得動態平衡。亟待構建安全驅動的嵌入模式和價值對齊的運作范式、增強模型應用的技術防御并建設質量評價體系、完善圖書館知識服務中模型產品使用的政策法規監管措施并培養智慧館員的職業技能,積極推進智慧化的知識檢索、知識管理、知識共享以及其他智慧知識服務。
國家互聯網信息辦公室發布的《生成式人工智能服務管理暫行辦法》明確表示,國家堅持發展和安全并重、促進創新和依法治理相結合的原則,采取有效措施鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管。大語言模型嵌入圖書館知識服務的實踐活動應當重點關注數據安全和技術安全。不僅在數據訓練階段完善機器審查和人工審查制度,有效降低訓練數據集中偏見、虛假或不準確的文本數量,還應當運用容錯機制、增量學習和訪問控制等確保合規合理地使用企事業單位和個人數據,逐步構建包括內容來源標準、內容過濾工具、讀者反饋渠道等在內的大數據語言模型產品應用的安全驅動方式,推進圖書館知識服務的合理使用與創新發展。
數智社會的高速發展不僅需要實現人工智能和人類行為的時空對齊和事實對齊,更為重要的是智能技術的研發與應用必須符合人類的價值觀。價值對齊(value alignment)是人工智能發展中解決人工智能體(AI Agent)與人類價值觀不一致問題的核心治理手段。雖然人類社會長期處于多元價值觀的復雜格局,卻也在無數的自然災害與人為災難的磨礪中逐漸形成構筑以人為本、開放包容、可持續發展的全球命運共同體的基本共識。圖書館知識服務中嵌入的大語言模型產品的追求目標如果與圖書館的真實意圖存在較大差異,可能會造成嚴重的負面后果。亟待在模型設計層面確保生成式智慧系統理解人類設置圖書館的核心價值,“實現知識的自由存取,公正、平等服務于社會,滿足每個讀者的不同需求,為社會的進步與和諧發展做出應有貢獻”[19],并在模型應用的全生命周期中持續進行價值對齊的綜合評測、專家引導和人類反饋強化學習(RLHF)。例如,圖書館應當委托知識服務專家團隊定期評估模型產品輸出內容與圖書館核心價值的適配程度以及是否符合以人為本、技術可控和可持續發展等基本倫理原則。
大語言模型應用過程中存在較大的輔助攻破對抗機器學習防御的特殊風險[20]。有必要在其嵌入圖書館知識挖掘、知識管理與知識傳播的過程中制定清晰具體且可實操的數據標注規則與質量評估機制,通過數字水印等技術方法對數據資料進行適當標注,采用數據清洗和數據增強等技術手段避免數據缺失、數據噪聲、數據偏見等質量問題,利用人類反饋強化學習算法改進模型行為,增強模型系統的穩定性、可控性、可靠性、透明性、抗攻擊性、可追溯性和可解釋性,逐步健全讀者使用行為的監測方案和生成內容告警機制,及時發現和處理數據資源泄露等風險事件,降低智慧知識服務的經濟成本與運行耗費的碳排放量。
大語言模型應用于圖書館知識收集整理、共享共建、傳輸應用等可能導致知識產權、商業秘密、個人隱私等方面的違法違規風險且生成式內容造假等行為具有隱蔽性和分散性,亟待搭建規范性文件體系并完善公權救濟與監管懲戒機制。如《科技倫理審查辦法(試行)》(征求意見稿)提出建立倫理高風險科技活動的清單制度,大語言模型嵌入圖書館知識服務就屬于可能產生較大倫理風險的新興科技活動,應當及時實施科學合理的清單管理;又如,《互聯網信息服務算法推薦管理規定》《互聯網信息服務深度合成管理規定》《生成式人工智能服務管理暫行辦法》等提出的算法備案、安全評估、人工智能生成監管等制度要求同樣適用于圖書館知識服務中應用大語言模型的具體場景,有必要在《檔案法》和《公共圖書館法》和各地區的《圖書館管理條例》及其細則中適當闡明大語言模型應用的關聯概念、風險預防、歸責原則等。同時,通過圖書館和人工智能行業的自律規則建立敏感信息登記備案制度、定期進行知識服務中嵌入的大語言模型產品的抽檢評估與預警機制并完善替代運轉的人工平臺等。此外,不同類型的圖書館(如公共圖書館和高校圖書館、研究型圖書館和通識類圖書館、自然科學類圖書館和社會科學類圖書館等)在知識服務的內容與方式上存在較大差異,相應的監管要求應當有所不同。
嵌入多維大語言模型產品的圖書館智慧知識服務的有序運轉對于館內工作人員的信息素養與業務能力提出了更高要求,“不再是中介性的角色,而是具有高學歷的高素質人才,同時具備服務能力與研究能力的專家型館員隊伍”[21]。數字強國背景下生成式人工智能廣泛應用于圖書館的知識服務領域,意味著館員應當是充分掌握數字技術的高素質、高效率、高水平的知識工作者,不僅需要承擔參考咨詢職責和學科信息服務職責,還應當能夠融合高水平專業背景知識與數智科技,具備技術開發、技術評估和技術應用等職業能力,能夠監督審核知識服務中大語言模型的應用狀況。由此,智慧圖書館不僅需要培養現有館員,還有必要招聘更多的具有新技術能力和智慧素養的新館員,完善館員信息技術、職業素養與科學技能的職業能力標準,推動制定適應數智社會發展的館員認證體系并定期開展專題講座、試點操作、考核評估等[22],大力落實激勵與懲戒機制。
數字強國背景下迭代發展的大語言模型深度改變了人類社會從信息搜索到科研創造的游戲規則,已經呈現出同質化競爭的趨勢,“需要思考更多大模型之外的設計——如何圍繞大模型來構建智能系統解決真實世界中的紛繁復雜的問題,如何讓這個系統更深度地‘思考’,更理智地決策,更有效地執行”。亟待加速發展垂直行業專用的自主可控的模型產品,為新興數智技術融合圖書館知識服務營建良好的生態環境。有必要迅速厘清大語言模型嵌入智慧圖書館知識服務的多元價值、運行機理、風險范式與管控策略,充分發揮模型產品驅動智能化、高效化、個性化的高質量知識服務的關鍵作用。