摘要:文章闡述了生成式人工智能賦能智慧圖書館建設可以極大地提升用戶體驗,為圖書館服務創新帶來無限可能,但也面臨著風險挑戰。圖書館在積極尋求技術賦能的同時要保持審慎的態度,在充分尊重用戶隱私和保障用戶信息安全的基礎上發展適用于圖書館需求的智慧化服務創新,規避技術背后的安全風險。
關鍵詞:生成式人工智能;智慧圖書館;應用場景;策略;風險
中圖分類號:G250.1文獻標志碼:A
0 引言
近年來,以ChatGPT為代表的生成式人工智能技術的出現引發了全世界的人工智能熱潮,為各行業帶來新的發展契機,也對智慧圖書館的發展產生了重要影響。如何將生成式人工智能技術融入圖書館服務創新與體系重構中,提升圖書館信息檢索和知識服務的智慧化水平已經成為業界關注的重點。技術賦能帶來了數據真偽、個人隱私泄露、知識產權和學術道德等風險。本文旨在探討生成式人工智能賦能圖書館創新的實現策略,并深入分析其中可能面臨的風險和挑戰。
1 生成式人工智能對圖書館事業的沖擊與機遇
2022年11月,OpenAI公司發布的智能聊天機器人ChatGPT引發了全球范圍內的人工智能熱潮。隨后,各大科技公司競相加入大語言模型(Large Language Model)賽道,微軟將GPT集成到“必應”搜索引擎中,谷歌發布了Bard,隨后推出了生成式人工智能模型“雙子座”。國內的大模型應用也迅速推出,如文心一言、訊飛星火、智譜清言、紫東太初、通義千問等,大模型可以進行文案創作、語音識別、編寫代碼、繪畫、視頻制作等任務。生成式人工智能展現了廣闊的應用前景,為各行業的數智變革帶來了新的發展機遇。對圖書館而言,生成式人工智能帶來巨大沖擊的同時伴隨著巨大的發展機遇。學界對生成式人工智能對圖書情報工作的沖擊和影響展開了大量研究。儲節旺等[1]認為AIGC技術應用到圖書館服務可以優化知識組織方式,提升知識服務能力;張智雄等[2]、尹克寒[3]研究了ChatGPT對情報信息工作的影響;李書寧等[4]從圖書館業務效率提升、智能咨詢和檢索服務等角度探討了ChatGPT對圖書館行業的機遇與挑戰;趙瑞雪等[5]認為人工智能技術可以提升圖書館智能知識服務水平;郭亞軍等[6]研究了ChatGPT賦能圖書館知識服務的原理、場景與進路等。研究表明,生成式人工智能在圖書館智能檢索、資源組織與管理、知識發現、學科服務、參考咨詢、閱讀推廣領域有廣闊的應用前景。圖書館必須重視生成式人工智能帶來的信息生產方式變革以及用戶信息獲取方式變革,積極利用生成式人工智能實現資源與服務的轉型與升級,推動多資源環境下知識服務場景的范式轉變,為用戶提供更加智慧化、精準化和個性化的服務,提升服務的質量和效率。
2 生成式人工智能賦能智慧圖書館服務應用場景
2.1 智能化檢索服務場景
圖書館現有的檢索系統以關鍵詞和主題檢索為主,借助布爾邏輯式和高級檢索來限制檢索范圍,這些檢索技能需要進行專業的信息素養培訓,部分用戶因為缺乏專業訓練,不了解檢索規則,很難得到滿意的檢索結果。利用生成式人工智能打造圖書館的智能檢索平臺可以有效降低使用門檻,讀者只要按照自己的需求用語言如實陳述,就可以快速得到想要的結果。生成式人工智能可以結合讀者的搜索歷史、瀏覽記錄、興趣偏好為讀者提供個性化推薦,節省讀者的信息篩選時間,提升檢索效率。
2.2 智慧化知識服務場景
知識服務能力的提升是智慧圖書館建設的重點。圖書館可以利用生成式人工智能的信息抽取、主題識別和分類能力對現有資源進行重新組織和整理,使得圖書館資源管理從主題、關鍵詞、摘要等表層信息深入到文獻內容層面,實現細粒度知識的挖掘、重組和分析。建立不同數據類型之間的關聯,進行主題化、專題化的分類揭示,形成高質量的知識庫系統。服務方面,利用人工智能的學習能力、邏輯推理能力,圖書館可以根據用戶的需求和指令,自動抽取和總結文獻內容;分析學科發展趨勢和研究熱點,自動生成分析報告;幫助用戶精準快捷地實現雜亂信息到結構化知識的轉換。圖書館可以在全面了解用戶知識需求的基礎上,為用戶打造個性化知識社區,構建以用戶為中心的知識網絡,提升智慧化知識服務能力。
圖書館可以利用生成式人工智能開發智能問答機器人,為用戶提供不受時空限制的參考咨詢服務。用戶以自然語言方式提問,機器人通過對話精準識別用戶的意圖,進行相關信息的檢索和回答,大大提高了智能咨詢服務的覆蓋面和質量。機器人可以根據用戶的瀏覽歷史和閱讀數據分析用戶需求,提供更加準確和有針對性的咨詢建議,進而為用戶提供個性化的閱讀推薦和定制化的服務。
2.3 沉浸式虛擬閱讀體驗場景
圖書館可以利用生成式人工智能的圖像識別、視覺推理、多模態融合等技術將重點資源可視化,構建虛實融合的閱讀空間,為讀者打造高沉浸感的閱讀體驗場景。比如讓讀者以“虛擬化身”形式“進入”文學作品中,通過“穿越”古代場景或“進入”虛幻世界達到“身臨其境”的效果。讀者從之前依托文字描述進行“想象”的旁觀者,轉變為親身體驗的互動者和參與者,這種“虛實相融”的新型閱讀場景可以帶來高沉浸感的閱讀體驗和樂趣。圖書館還可以結合虛擬現實技術生成虛擬數字人,虛擬數字人具有類人情感和邏輯思維能力,與讀者的溝通交流更加流暢自然,可以帶領讀者沉浸式體驗書本內容,分享閱讀心得、解析作品內涵等。
2.4 個性化信息素養教育場景
傳統的信息素養教育主要以推介資源和培訓信息素養為主,隨著自然語言理解與處理技術的廣泛應用,對用戶來說,復雜專業的檢索知識不再是必須技能,更重要的是學習如何準確表達自己的需求,以獲得更有價值的結果。“高效提問的能力”成為人工智能時代信息素養教育的重點。圖書館必須適應用戶信息需求的變化,利用生成式人工智能打造個性化的信息素養教育場景,培訓用戶掌握正確的人機互動方法以及如何通過反饋快速解決問題的技能。利用人工智能打造用戶專屬的虛擬學習空間,智能機器人可以輔助用戶制定學習計劃、進行知識點總結、課程測試等,幫助用戶提升學習效率。這種智能化、個性化的教學方式能夠使信息素養教育更有針對性,提升教學質量和學習效率。需要注意的是,智能機器人并不完全具備人類的高階思維能力和推理能力,在利用智能機器人進行信息素養教育時,必須人機協同工作,以人類教育為主,機器人智能輔助為輔,教育者需要關注智能工具的使用限制,對因為技術原因產生的知識覆蓋面不足、錯誤回答等問題及時進行人工審核和信息勘誤,警惕安全風險,保護用戶隱私。要關注用戶對智能工具的過度依賴問題,加強用戶的批判思維和獨立思考能力的培養,引導用戶多方查證信息來源,多角度思考問題,而不是對智能工具盲目信任。
3 生成式人工智能賦能智慧圖書館服務創新的實用策略
3.1 創新館藏資源建設與管理模式
在文獻資源建設方面,圖書館可以利用智能工具自動分類采編數據,校訂書目信息,更加便捷地分類和管理文獻,提升數據質量和編目效率。圖書館可以利用AIGC技術中的Transformer架構進行遷移學習,借助預訓練的模型提高圖書館現有館藏數字資源的數據發現能力和資源組織水平。模型的強大數據分析與處理能力可以實現多模態數據的實時采集與分析,將不同模態的資源進行優化整合。通過對特色資源和特定專業領域知識的內容挖掘,實現資源細粒度知識的組織和揭示,打造特色專題知識庫,滿足專業領域高質量的知識服務需求。目前,商業用的大模型數據主要是網絡公開資源,在專業性和準確性上存在不足,圖書館豐富的館藏資源可以為大模型訓練提供高質量的語料庫,發揮資源的最大社會效益和經濟效益,為社會提供更多的知識價值。數據與算法模型是生成式人工智能的基礎,由于大模型的投入成本與算力要求很高,圖書館無力承擔技術與成本需求,政府可以進行統籌規劃,圖書館與互聯網公司合作開發圖書館應用模型。
3.2 構建智慧化的知識服務新方式
圖書館可以利用AIGC技術對館藏數據實現有效管理和深度挖掘,從海量數據中挖掘潛在的關聯關系和深層次的語義信息,為用戶提供更加智慧的知識發現服務。首先,通過構建知識圖譜實現知識的智能化組織與管理,將不同領域的知識進行語義化表示并建立關聯,幫助用戶快速定位相關知識和深度探索關聯知識,實現知識的精確匹配與自動推薦。其次,為用戶提供文獻解析、熱點追蹤、科研寫作等深層次的知識服務,幫助用戶發現科研思路、分析整理文獻、制定研究方法等,成為用戶高效率的科研助手。
3.3 打造智能問答系統和個性化閱讀推薦平臺
利用生成式人工智能開發智能問答系統,用智能問答代替傳統的信息檢索,根據用戶需求,使用文本、語音、圖片、視頻等多模態信息輸出代替單一的文本輸出。智能問答系統的核心是人工智能算法,借助自然語言處理技術、語義關聯技術了解用戶的提問意圖,并根據語義相似性和上下文關系為用戶提供回答建議。系統不僅會通過監督學習和無監督學習方法進行模型訓練,還會利用強化學習和深度學習等技術不斷修正結果,提高回答效率和準確性。
圖書館可以通過多模態信息資源的匯聚整合打造個性化的閱讀推薦平臺,基于用戶的檢索歷史和興趣偏好,為其進行個性化的閱讀推薦,為用戶提供更具深度和廣度的閱讀指引。可以通過對用戶閱讀時段、閱讀時長與閱讀頻率等數據的分析,了解用戶的閱讀情況和滿意度,通過反饋學習,不斷優化推薦效果。圖書館還可以借助人工智能技術生成虛擬數字人作為閱讀推廣形象大使,通過生動的形象向公眾展示圖書館的資源和服務,增強讀者的認知度和親近感,為用戶提供更加智慧、高效、個性化的閱讀體驗。
4 生成式人工智能技術的使用限制和安全風險
4.1 輸出數據的真實性問題
智能對話機器人的技術基礎是生成式大語言模型,它基于大量的計算和概率分布生成最符合要求的答案,并不能保證生成內容的真實性和準確性。一些專業領域問題或者模型訓練數據中沒有的知識,機器人無法提供準確的回答,會出現回答質量不穩定或者編造答案的情況。因此,智能對話機器人應用于圖書館參考咨詢、智能檢索服務時,必須與人工服務相結合,對服務內容進行人工審核和勘誤,避免給用戶帶來不必要的誤解或錯誤。
4.2 個人隱私數據泄露風險
智慧圖書館的智能化檢索、個性化知識服務需要收集大量用戶數據,如姓名、電子郵箱、電話或者人臉識別信息等敏感信息,在收集、使用用戶數據的過程中,會存在擴大收集范圍、侵犯用戶隱私等風險,如果管理的數據被泄露和濫用,可能會導致網絡詐騙、網絡暴力、人身歧視等問題。因此,圖書館在使用人工智能技術時要重視個人隱私數據安全,遵守相關的政策和法規,如2023年8開始施行的《生成式人工智能服務管理暫行辦法》《中華人民共和國個人信息保護法》《數據安全法》等,在收集、使用、存儲、傳輸用戶個人信息時,應該遵循最小必要、知情同意、安全合法、保護隱私等原則[7]。圖書館應該采取措施對用戶的個人信息進行加密處理,避免被泄露和濫用。相關工作人員要進行培訓,增強隱私保護意識,嚴守操作規程,向第三方提供用戶信息時應該遵守法律規定,征得用戶同意,對敏感信息進行脫敏處理,避免用戶隱私泄露。
4.3 知識產權和學術道德風險
生成式人工智能在圖書館服務中的知識產權問題,一是生成內容的著作權問題,我國法律目前對于人工智能創作的作品著作權歸屬還沒有明確規定。二是智能對話機器人在提供服務時生成的回答和建議可能包含了擁有版權或專利保護的內容。圖書館在使用人工智能進行知識服務的時候要確保使用經過合法授權的資源,加強監管,遵循相關法律法規,避免侵犯他人知識產權。涉及學術研究或論文寫作方面問題時,應注意遵守學術道德規范,明確侵權責任和懲罰措施,確保任何生成的數據或回答都符合學術誠信的要求,避免產生學術不端或抄襲的行為。
5 結語
面對人工智能發展浪潮,圖書館在積極尋求技術賦能的同時要保持審慎的態度,充分認識到人工智能技術給圖書館帶來的機遇與挑戰,保持技術理性和價值理性的平衡,在充分尊重用戶隱私和保障用戶信息安全的基礎上發展適用于圖書館需求的智慧化服務創新,規避技術背后的安全風險。
參考文獻
[1]儲節旺,杜秀秀,李佳軒.人工智能生成內容對智慧圖書館服務的沖擊及應用展望[J]情報理論與實踐,2023(5):6-13.
[2]張智雄,于改紅,劉熠,等.ChatGPT對文獻情報工作的影響[J].數據分析與知識發現,2023(3):36-42.
[3]尹克寒.ChatGPT的發展對情報信息工作的影響及啟示[J].圖書館理論與實踐,2023(3):15-22.
[4]李書寧,劉一鳴.ChatGPT類智能對話工具興起對圖書館行業的機遇與挑戰[J].圖書館論壇,2023(5):104-110.
[5]趙瑞雪,黃永文,馬瑋璐,等.ChatGPT對圖書館智能知識服務的啟示與思考[J].農業圖書情報學報,2023(5):29-38.
[6]郭亞軍,馬慧芳,張鑫迪,等.ChatGPT賦能圖書館知識服務:原理、場景與進路[J/OL].圖書館建設:1-16[2024-02-28].http://kns.cnki.net/kcms/detail/23.1331.G2.20230713.1606.004.html.
[7]徐芳.智慧圖書館生成式人工智能應用場景及其法律問題[J/OL].情報資料工作:1-10[2024-02-28].http://kns.cnki.net/kcms/detail/11.1448.G3. 202312 25.1753.005.html.
(編輯 何 琳編輯)
Implementation strategies and risk challenges of generative artificial intelligence empowering innovation in smart libraries
Yan? Fangfang
(Library, Henan University, Kaifeng 475001, China)
Abstract: ?The article elaborates that empowering smart library construction with generative artificial intelligence can greatly enhance user experience and bring infinite possibilities for library service innovation, but it also faces risks and challenges. While actively seeking technological empowerment, libraries should maintain a cautious attitude and develop intelligent service innovations that are suitable for library needs, and fully respecting user privacy and ensuring user information security, to avoid security risks behind technology.
Key words: generative artificial intelligence; smart library; application scenarios; strategy; risk
基金項目:2022年度河南省圖書情報研究項目;項目名稱:新媒體時代高校圖書館信息素養教育新路徑探析——以媒介素養為例;項目編號:HNTQL-2022-107。
作者簡介:閆芳芳(1980— ),女,館員,碩士研究生;研究方向:信息素養教育,閱讀推廣。