
[摘 要]介紹生成式人工智能(Genarative AI)的概況與分類,通過文獻分析法與歸納總結法論述生成式人工智能在圖書館服務應用中的優勢和劣勢,分析其在圖書館各項服務中的應用前景。分析其在圖書館服務、圖書館管理等方面應用的潛在優勢,同時指出圖書館應積極采取相關措施應對成本大幅增加、館員職業恐慌、信息偏差或著作權不明等問題。
[關鍵詞]圖書館 人工智能 AI AIGC ChatGPT
[分類號]G252
1 引言
人工智能作為未來經濟和社會發展的重要技術,日益被國際社會所重視。2022年11月,OpenAI發布了生成式人工智能ChatGPT。2023年1月,平均每天約有1300萬獨立訪客使用ChatGPT,累計用戶超1億,創下了互聯網最快破億應用的記錄,超過了此前TikTok 9個月破億的速度。
ChatGPT是一款基于GPT3.5技術的大型語言模型生成式機器人,能夠以對話的形式與人類交互,完成命題寫作、創意寫作、摘要生成等功能。ChatGPT基于Transformer模型,通過引入人類反饋強化學習(RLHF),大幅提高了人工智能在人機對話時的準確度和可控性。與其他人工智能對話機器人相比,ChatGPT具有強大的語言理解能力和更豐富的語言表達能力,能夠生成更自然、更流暢的文本,回答非常復雜的推理問題。
作為一款現象級的生成式人工智能,ChatGPT核心能力如下:(1)問題的理解能力大幅提升,提升了模型和人類意圖的一致性,具有記憶能力,可以實現連續多輪對話;(2)結果的準確性大幅提升,主要表現在回答得更全面,同時能主動承認錯誤、發現無法回答的問題;(3)具備識別非法和偏見的機制,針對不合理提問進行提示并拒絕回答;(4)理解用戶需求并創造內容,甚至可以協助其進行代碼編寫。綜上,ChatGPT被認為是一款自然對話型生成式人工智能。
人工智能的發展經歷了3次浪潮[1]。1956—2006年為第一階段,這是奠定人工智能發展基礎的理論知識積累時期,受限于數據規模與算力,人工智能更多還是停留在研究及理論階段,并未投入實際應用。2006—2016年為第二階段,在這個時間段,隨著互聯網技術的快速發展,機器學習開始崛起,算法、算力與數據規模都較第一階段有了質的飛躍,三者效用疊加后催生AI在計算機視覺、語音識別等多個領域的應用突破,初步具備商業化的應用能力。第三階段為2016年至今,以“Alpha Go打敗李世石”為里程碑事件,AI賽道掀起投資熱潮,在政策扶持及資本推動的背景下,AI被應用到越來越多的場景,如安防、交通、自動駕駛、醫療等。
縱觀與“圖書館”“人工智能”“AI”相關的文獻資料,圖書館界已有不少專家提出,圖書館在人工智能迅速發展變化的時代背景下應當主動擁抱新技術、新變化。自1986年有學者編譯了來自Library Journal的關于“人工智能與圖書館”的相關介紹起[2],圖書館與人工智能的研究便源源不竭。2017年6月,《圖書與情報》在“人工智能與圖書情報”專欄中集中發表了吳建中、王世偉、黃曉斌、葉鷹、李廣建、黃水清等18位學者的相關論文。吳建中呼吁圖書館要以更積極的姿態擁抱人工智能,激活圖書館的交流功能和服務效能,做出更多貢獻[3]。王世偉指出,人工智能對圖書館的服務重塑需要圖書館人主動地進行開拓[4],人工智能能夠為圖書館服務提質擴容,圖書館人應當順勢而為,發揮頭雁效應[5]。郭亞軍等在分析圖書館領域人工智能研究熱點的基礎上,提出圖書館領域內的AI研究已經較為廣泛,為實際應用提供了重要支撐,但在理論研究、關鍵技術等方面有待完善[6]。儲節旺等提出人工智能將傳統圖書館變革成為具有無人化、數字化、個性化、場景化和智能化五大特征的新型圖書館[7]。李菲菲從智慧圖書館建設角度出發,認為應當借勢人工智能助推智慧圖書館在時代潮流中智能化、智慧化、可持續化發展[8]。在人工智能持續不斷的熱潮下,也有學者提出了“冷思考”。如,鄧李君等分析了圖書館應用人工智能過程中面臨的用戶感知價值、數據倫理、實驗應用轉化方面的障礙[9];陸穎穎等總結與梳理了2021年CILIP專題研討會中提出的人工智能給信息服務帶來的機遇與挑戰,為我國信息與圖書館行業的發展提供參考與借鑒[10]。
在應用與實踐領域,也有不少學者就實際案例進行了介紹。韋景竹等介紹了日本圖書館圍繞機器人應用、智能空間建設、古籍草書文本識別等開展的智能服務,并提出了我國智慧圖書館建設路徑[11];劉家成介紹了人臉識別、信息檢索、智能薦書等人工智能技術在廣州越秀區圖書館的應用[12];劉圣軍從篩選、管理、閱讀系統等方面介紹了人工智能在傳統微縮技術改革上的優化[13]。但圖書館在生成式人工智能影響下的實踐或應用的相關研究尚未成熟,僅李白楊等提出人工智能生成內容(AI Generated Content,AIGC)會在信息組織數據、資產管理、用戶研究和信息倫理4個角度為信息資源管理方面帶來實質性影響[14]。
2 生成式人工智能與圖書館
2.1 生成式人工智能及分類
生成式人工智能,也就是可以實現AIGC的人工智能。AIGC被認為是繼UGC(User Generated Content,用戶生產內容)、PGC(Professionally Generated Content,專家生產內容)之后的新型內容生產方式。如AI繪畫、AI寫作等都屬于AIGC的分支,可以說生成式人工智能是目前人工智能最具風口的賽道。創造是生成式人工智能的核心,其本質與目的就是實現生產力的大幅度提升,因此生成式人工智能的應用非常廣泛,可在市場營銷、設計策劃、生產內容等領域進行創造性工作。對生成式人工智能來說,2022年被認為是其發展速度驚人的一年。
根據Roberto Gozalo-Brizuela等學者對大型生成式人工智能模型的研究[15],可將其按照任務模態分為以下9類(見表1)。任務模態包含文本、圖像、視頻、音頻、3D模型等之間的轉換,其中多為跨模態的生成式人工智能。
跨模態內容生成是生成式人工智能的一個重要應用領域,即利用一種或多種形式的輸入數據(如圖像、文本、語音等)自動生成具有不同形式的輸出內容。如輸入一張圖像和一段文字描述后生成一張帶有文字說明的圖像,或輸入一段語音后生成相應的文本描述。
放眼圖書館領域,跨模態內容生成可以應用于各類帶有數字化背景的項目。如使用生成式人工智能自動生成與特定文獻相關的圖像,完善文獻的可視化程度;將實體文獻或其他館藏轉化為虛擬的三維模型,使讀者更直觀地了解相關知識。
2.2 生成式人工智能在圖書館的應用分析
生成式人工智能在圖書館的應用可以極大地提升圖書館的工作效率和用戶體驗,提升圖書館服務能力,改變圖書館員的工作方式和圖書館管理方式,尤其在圖書館提升服務能力上,可以帶來更高質量、更全面的場館空間服務、信息檢索與參考咨詢服務、閱讀推廣服務、新媒體與數字閱讀服務。這將引發圖書館服務理念的變革,推動圖書館服務創新。
2.2.1 提升圖書館服務能力
在場館空間服務方面,生成式人工智能可用于分析圖書館場館空間的相關數據,并提出建議。從智慧場館建設角度出發,通過收集大量圖書館建筑空間的數據,包括室內外空間布局、建筑要素、設備配置和訪問者行為等,實現全流程的自動化管理與高效運營;利用數據采集,整合建筑空間結構、設備布局、訪問者行為變化等數據,為圖書館空間的使用和調整提供重要參考,為圖書館空間規劃給出符合未來發展和用戶需求的策略與建議。
在信息檢索與參考咨詢服務方面,生成式人工智能將為圖書館帶來更多元化、精準化的服務能力。尤其是“從文本到文本”模態的生成式人工智能,可以通過RLHF訓練模型和語料庫學習,更好地滿足讀者對信息檢索、參考咨詢的需求,幫助圖書館為讀者提供更加精準的服務。可以根據數據庫的內容和特點,對數據庫中的信息進行主題和關鍵詞抽取并智能分類,便于讀者搜索和獲取所需要的文本。也可以根據讀者的使用偏好,快速篩選出最符合其需求的內容,提高檢索效率。
在閱讀推廣服務方面,生成式人工智能將為圖書館帶來更個性化、更高效的服務能力。如圖書館可根據讀者需求生成不同的閱讀推廣素材與內容,利用“從文本到圖像”“從文本到視頻”“從文本到音頻”等多種模態的人工智能,實現文字、圖片、音頻、視頻等多元化內容供給,在閱讀推廣活動的海報設計、文案撰寫、宣傳展示等方面提升曝光度與吸引力。尤其在圖書館的線上閱讀推廣活動中,可以向讀者提供基于興趣分析的推薦和個性化服務。一方面可以為圖書館的活動提供個性化的宣傳海報,另一方面可以幫助圖書館撰寫更有吸引力的文案,提高活動的曝光率,吸引更多的讀者參與其中。
在新媒體與數字閱讀服務方面,生成式人工智能將為圖書館帶來更高效、更智能的服務能力。如利用生成式人工智能技術輔助開展智能問答、智能推薦等服務,根據讀者的閱讀偏好和歷史行為,為其推薦最適合的數字文獻資源,提升其閱讀體驗。利用生成式人工智能在新媒體渠道更新智能應答機器人,利用其超強的自然語言能力,幫助館員處理一般日常性的咨詢及評價,提升讀者對圖書館響應的滿意度。
2.2.2 改變圖書館員的工作方式
生成式人工智能技術能提升圖書館員工作效率,也能夠幫助圖書館創建“數字館員”。從業務輔助角度來看,生成式人工智能可幫助圖書館員對讀者的身份、行為、情感進行分析,輔助館員進行讀者需求收集及行為分析,為館員提供個性化信息決策服務、輔助完成創新創意相關工作,大幅提高工作效率。
目前,“虛擬館員”這一概念漸漸走入實踐層面[16],各個圖書館探索由生成式人工智能技術支撐的“超級館員”,為讀者提供預約、導航、查詢等一站式服務。如,2019年天津大學圖書館投入使用的“智圖”機器人集人工智能、導航、地圖構建、射頻定位、計算機視覺等多項技術為一體,可實現自動化、智能化的圖書盤點操作。與傳統人工盤點相比,它能夠快速適應新的、復雜的應用場地,有效避讓人或障礙物等,大幅提高準確性和時間效率。又如,上海長寧區圖書館在2022年推出的“馨葉”數字人館員采用人工智能、計算機視覺、自然語言處理等技術,主動向讀者提供智能便捷的引導服務,并能根據讀者以往的借書喜好,向讀者個性化推薦館內新書和熱門圖書。可見,生成式人工智能技術在圖書館場景中的應用可以極大增強人機交互體驗,提高讀者的發現和閱讀效率。
2.2.3 改變圖書館的管理或決策
生成式人工智能可以用來分析圖書館服務。首先,可通過收集大量的讀者反饋、社交媒體數據和圖書館服務的使用情況,運用“從文本到科學信息”的人工智能模態,獲取有關圖書館服務質量的文獻信息與資料,為提高服務質量提供有力依據。其次,可利用生成式人工智能發現圖書館服務的模式和規律,如服務項目的變化趨勢、讀者反饋的變化及其影響因素等,這些信息可以為改善服務提供重要參考。最后,可以利用生成式人工智能來預測圖書館服務的未來發展趨勢,為圖書館服務的進一步改善提供依據。
2.2.4 促進圖書館服務理念的變革
如上所述,圖書館應用生成式人工智能,尤其是合理利用跨模態內容生成,將會促進圖書館服務理念變革,創新圖書館服務方式。一是由大眾式服務向個性化服務轉變。生成式人工智能技術可根據讀者在圖書館內的各種行為數據進行分析,為其提供個性化推薦,以需求為導向提供定制化的服務內容,并實時更新推薦結果。二是由被動服務向主動服務轉變。圖書館可以根據讀者的實際需求、閱讀習慣、瀏覽軌跡等信息來自動推薦閱讀內容并提供相關服務。
3 障礙與困境
伴隨著生成式人工智能在圖書館的應用,也會給圖書館、圖書館員、人工智能生成內容本身帶來一些問題。
3.1 產生信息偏差
由于人工智能技術尚未完全成熟,許多機器無法對用戶提出的更復雜的問題做出準確回答,難以充分理解和分析信息內在的邏輯關系。正如ChatGPT操作界面所提示的“可能偶爾會產生不正確的信息”“可能偶爾會產生有害的指示或有偏見的內容”等,生成式人工智能有可能受數據庫、語料庫、算力等條件的約束,生產出不正確的信息,造成“謬誤”。比如,請ChatGPT用一句話描述《長安的荔枝》是一本什么樣的書,它回答“《長安的荔枝》是一本以歷史為背景的青春文學小說,以愛情故事為主線,描述了唐朝長安城內外發生的一系列事件。”回答雖語言流暢,但信息存在巨大誤差。
3.2 增加成本
在引入生成式人工智能技術幫助提高服務水平時,無論圖書館選擇購置、裝配相關設備,還是以購買第三方服務的形式來實現,都需要投入較高的人力、財力和時間成本。首先,圖書館需要對生成式人工智能相關的技術人員進行專業級的培訓,花費大量時間和金錢。其次,生成式人工智能需要長期地訓練以及準備與圖書館相關的大量訓練數據,以便其能夠正確地識別和理解與圖書館相關的內容,從而輸出正確的信息。最后,需要長期持續投入來確保生成式人工智能的更新及維護。
3.3 帶來館員職業恐慌
從圖書館的知識、數據獲取與共享,用戶交互,分析、生成數據等業務視角來看,生成式人工智能作為圖書館員的輔助型工具,無疑會大幅提升館員的工作效率。但“Stable Diffusion”這款人工智能工具可以根據人類提供的文字描述瞬時生成相匹配的圖像,也確實給整個商業藝術界和設計界都帶來了恐慌。因此,圖書館內可能會產生館員無法適應“人+機器”的工作模式以及勞動力過剩等問題,進而對館員的身心健康狀況產生影響。
3.4 存在權利糾紛及信息泄露風險
圍繞人工智能生產內容的著作權保護和權利歸屬問題,學界仍爭議不斷。人工智能生產內容實際上是“人”與“機器”共同創作完成的,法律上如何界定人工智能生成作品的著作權仍懸而未決,有待完善[17]。我國現有法律法規中缺乏針對人工智能技術類信息內容保護的相關規定,也缺乏明確具體的權利歸屬關系和相關法律責任追究條款。此外,人工智能技術產生的信息內容需保證其合法性,如若缺乏對人工智能技術類信息內容的監管,可能會產生用戶數據信息及隱私泄露等風險。
4 展望與思考
4.1 積極推動生成式人工智能技術在圖書館的應用
圖書館是人類知識的保存機構,是人類文明的重要組成部分,應更好地服務社會,為全民終身學習提供優質環境。圖書館順應時代潮流,通過數字資源建設向讀者提供高質量服務,實現文獻資源共建共享,合理利用生成式人工智能技術,促使自身服務業態向智慧化、數字化的轉變,在合理合法的范圍內,通過生成式人工智能實現數據資源向知識資產的轉化。
4.2 利用生成式人工智能實現向智慧圖書館的蝶變
圖書館應當利用人工智能技術實現向智慧圖書館的轉型,通過建設智能圖書館信息管理系統整合各類資源。要以滿足用戶需求為目標,將人工智能技術融入智慧圖書館建設中來,整合現有的文獻管理、流通服務、讀者服務和自助檢索服務等系統的傳統資源和技術手段,與人工智能、大數據、云計算深度融合,為用戶提供圖書館的智慧服務。
4.3 培養順應人工智能技術潮流的圖書館員
培養人工智能技術與圖書館專業教育有機融合的復合型圖書館員。如充分發揮高校、科研院所和社會力量在圖書館人才培養方面的作用,加強圖書館與高校、企業之間的合作,推動人工智能在圖書館領域的應用推廣;加快人工智能專業教育體系建設,不斷優化與完善學科體系;重視對圖書館內專業技術人員、智能服務開發利用人員的培養工作,建設具有人工智能學科背景的專業館員隊伍。
4.4 注重知識產權的保護
在使用生成式人工智能技術的過程中,圖書館界要重視知識產權保護工作。應當呼吁進一步完善相關法律法規和知識產權保護政策,加快人工智能技術知識產權保護的立法進程,在新一輪全球科技競爭中搶占先機,不斷提高相關工作的管理水平。
5 結語
綜上所述,生成式人工智能技術的優勢顯而易見,對圖書館而言既是風口,也存在危機。圖書館應該加快發展步伐,積極探索生成式人工智能技術在圖書館的落地與應用,同時也應當密切關注人工智能可能會給圖書館帶來的種種問題。在順應時代發展和讀者需要的同時,應積極擁抱生成式人工智能技術的優勢,實現向智慧圖書館的蝶變,推動圖書館的高質量發展。
參考文獻:
[1] 熊輝.人工智能發展到哪個階段了[J].人民論壇,2018(2):14-16.
[2] 簡明.人工智能與圖書館[J].情報知識,1986(3):29-30.
[3] 吳建中.人工智能與圖書館[J].圖書與情報,2017(6):1-5.
[4] 王世偉.人工智能與圖書館的服務重塑[J].圖書與情報,2017(6):6-18.
[5] 王世偉.深化人工智能與圖書館更新的若干問題——再論人工智能與圖書館更新[J].圖書與情報,2020(3):93-103.
[6] 郭亞軍,等.AI賦能圖書館:研究熱點、問題與展望[J].圖書館學研究,2020(6):2-8,38.
[7] 儲節旺,陳夢蕾.人工智能驅動圖書館變革[J].大學圖書館學報,2019(4):5-13.
[8] 李菲菲.基于人工智能的智慧圖書館建設的邏輯和方法研究[J].情報科學,2021(12):87-92.
[9] 鄧李君,張曉梅,戴君琴.圖書館應用人工智能的障礙與對策分析[J].圖書館工作與研究,2022(4):65-69.
(下轉第103頁)
(上接第94頁)
[10] 陸穎穎,等.人工智能、機器學習、自動化和機器人技術對信息行業的影響——2021年CILIP專題研討會綜述與啟示[J].圖書情報工作,2022(19):143-152.
[11] 韋景竹,葉彥君.日本圖書館人工智能研究與應用前沿[J].圖書館論壇,2022(8):51-61.
[12] 劉家成.人工智能技術在公共圖書館中的應用研究——以廣州越秀區圖書館為例[J].參花(上),2022(11):107-109.
[13] 劉圣君.人工智能圖書館在數字縮微建設中的應用[J].數字與縮微影像,2022(4):29-31.
[14] 李白楊,等.人工智能生成內容(AIGC)的技術特征與形態演進[J].圖書情報知識:2023(1):66-74.
[15] Roberto Gozalo-Brizuela, Eduardo C,Garrido-Merchan.Chat GPT is not all you need.A State of the Art "Review of large Generative AI models [EB/OL].[2023-02-13].https://doi.org/10.48550/arXiv.2301.04655.
[16] 高俊杰.基于機器人技術的圖書館虛擬館員服務探究[J].圖書館學刊,2016(1):113-115,137.
[17] 吳漢東.人工智能生成作品的著作權法之問[J].中外法學,2020(3):653-673.
陳 瑩 女,1989年生。碩士,館員。研究方向:圖書情報與數字圖書館、公共圖書館服務營銷。
(收稿日期:2023-03-02;責編:鄧鈺。)