摘要:為推動圖書館行業高質量發展,文章從能說會動、真情實感、能思會想3個層次闡述了虛擬數字人定義,提出了“以讀者為中心、提升交互能力、不侵犯讀者隱私”的構建三原則。從外觀生成、動作捕捉、語音合成3個方面介紹了圖書館虛擬數字人的構建方式。文章深入分析了圖書館在構建虛擬數字人過程中可能遇到的數據風險、技術挑戰、成本效益、法律與責任風險4類問題,提出了應對策略,即:規范數據采集、處理和管理;科學架構,優化算法;資源共享,成本共擔;完善頂層設計,保障讀者權利。
關鍵詞:虛擬數字人;AIGC;圖書館;閱讀服務
中圖分類號:G2507文獻標志碼:A
0引言
人工智能生成內容(Artificial Intelligence Generated Content,AIGC)是一種前沿創新技術,通過深度學習等尖端算法,巧妙地模擬了人類的創造過程,從而孕育出既新穎又引人入勝的內容產物。隨著多模態大模型的蓬勃發展,智能體(AI Agent)作為大模型與業務場景深度融合的主流形態,進一步拓寬了AIGC技術的應用場景[1]。近年來,國內圖書館在虛擬數字人應用探索上呈現出活躍的姿態,通過引入AI數字人交互設備,不斷開拓智能化服務的新范式,推進著虛擬數字人的落地與發展,也為圖書館服務模式的變革注入了新的活力。2021年,隨著元宇宙概念的“爆火”,其所涉及的生成式人工智能(GAI)、虛擬現實(VR)、增強現實(AR)、區塊鏈、云計算等尖端技術開始被大眾所關注。2021年6月,清華大學圖書館利用人工智能模型悟道20,推出了擬人形象的虛擬數字人“華智冰”,成為虛擬導覽與咨詢服務的重要創新示范。2022年5月,中共中央辦公廳、國務院辦公廳發布了《關于推進實施國家文化數字化戰略的意見》,提出需創新文化表達形式;同年10月,工業和信息化部等五部委印發了《虛擬現實與行業應用融合發展行動計劃(2022—2026年)》,指出必須加快推動虛擬現實技術與各行各業的深度融合。由此,圖情領域也緊隨時代步伐,興起了對虛擬數字人技術的深入探索和研究的熱潮。鄭聰等[2]探討了虛擬數字人在智慧圖書館建設領域的潛在應用場景;黃麗[3]著眼于圖書館虛擬數字人應用的風險評估;李雪慧等[4]深入剖析了將視角投向,對虛擬數字人在公共文化服務領域的畫像構建和設計;陳依夢等[5]聚焦于高校圖書館數字人文服務的探索。這些成果既加深了對數字人技術的理論研究,又為圖書館的實踐應用提供了相關參考。然而從整體情況來看,將虛擬數字人與AIGC技術相結合的研究還相對匱乏。本文基于AIGC技術探索構建圖書館虛擬數字人的路徑,探討該技術如何具體融入并優化圖書館的各項服務,對其在實際應用過程中可能遭遇的挑戰進行剖析,提出解決策略,旨在為圖書館虛擬數字人的發展提出切實可行的實踐框架。
1基于AIGC技術的圖書館虛擬數字人構建
11虛擬數字人定義與層次
虛擬數字人是指由計算機技術生成的,具有可以擬人的外貌和行為,并在數字環境下識別互動對象情感,與真人進行交互的虛擬實體。虛擬數字人發展經歷了3個層次:第一個層次是能說會動,即虛擬數字人在3D建模和渲染技術下,動作接近真人;第二個層次是具有真情實感,即利用AI模型和動作捕捉技術,使之變為一個具備性格特點且會情感表達的虛擬個體;第三個層次是能思會想,即通過自然語言處理結合深度學習模型,使虛擬數字人具備持續學習的能力[6]。
12構建原則
圖書館虛擬數字人的構建須遵循3項核心原則。一是要秉持以讀者為中心的理念。強調個性化服務供給,依據讀者閱讀習慣、興趣偏好等多元化信息,精準推送定制化服務與內容推薦,滿足讀者的深層次文化需求。二是要著力提升虛擬數字人信息服務交互能力。借助前沿的三維重建技術、動作捕捉系統及語音合成技術,精心打造外觀逼真、動作流暢、能與讀者自然交流的虛擬數字人。三是堅決不侵犯讀者隱私。在讀者數據的采集與使用上,嚴格遵守相關法律法規,通過嚴密的信息安全防護體系保障讀者隱私信息的安全。
13圖書館虛擬數字人的構建方式
131三維重建,生成外觀
通過生成對抗網絡(GANs)等復雜算法,自動化構建數字人的外觀模型。首先,在數據搜集階段,合法合規地廣泛收集大量的人臉圖像數據,將這些數據作為后續模型訓練的基礎素材。其次,在模型訓練環節,利用GANs等前沿算法對所搜集的人臉圖像數據進行深度訓練,不斷迭代與優化,生成高度逼真、細節豐富的數字人臉圖像。最后,利用三維重建技術,將二維圖像信息精確地轉換為具有立體感和真實感的三維模型,完整地塑造出數字人的外觀。
132動作捕捉,模擬行為
動作捕捉技術是指在精準捕獲并復現人類動作的基礎上,賦予虛擬數字人高度逼真的動作表現力。首先,借助高精度的專業動作捕捉裝備,實時、準確地捕捉人體各部位的細微運動軌跡,系統地記錄下人類在運動過程中的各項動作數據,為后續的動作分析與再現提供翔實的數據基礎。其次,對原始動作數據進行細致的清洗與預處理,剔除數據中的噪聲成分及異常值,確保數據的純凈度與準確性。同時,運用統計學方法、濾波技術等手段,有效提升數據質量,降低誤差干擾。最后,依托先進的AIGC技術,特別是循環神經網絡(RNNs)等深度學習算法,通過時序建模捕捉動作序列中的時間依賴關系,對經過預處理的動作數據進行深入學習、訓練與優化,從而使虛擬數字人動作表現得自然流暢,在數字場景中呈現出接近真人的效果。
133語音合成,自然交互
語音合成技術可以使虛擬數字人的發音習慣更接近真人。首先,須收集多樣化的語音數據,確保語音合成的豐富性與真實性。其次,通過前饋神經網絡、卷積神經網絡、遞歸神經網絡,結合反向傳播算法,提取語音數據的韻律節奏等聲學特征并精細建模,確保合成語音具有自然、流暢的特點。再次,根據適用環境調整虛擬數字人的說話速度、情感表達,動態生成與之匹配的自然語音。最后,利用自然語言處理技術,增強數字人的交互性,即:對讀者輸入的文本進行預處理,包括精確的分詞處理、詞性標注和文本規范化;通過命名實體識別、情感分析、句法解析等技術手段,對讀者輸入的文本進行深度解析,準確識別讀者的真實意圖與需求;通過語音合成技術,將對讀者的回復內容轉化為自然流暢的語音輸出,實現人機無縫對接、高效互動。
2圖書館構建虛擬數字人面臨的四大挑戰
21數據風險
圖書館是一座沒有圍墻的學校,包容均等地為每一個讀者提供閱讀服務是其基本職能。這也意味著其應用場景的多元化,導致收集到的訓練數據中會有缺失片段或者摻雜大量的噪聲,增加了圖書館處理數據的難度。圖書館若無法持續、穩定地獲取高質量數據,勢必會影響虛擬數字人的生成精度與交互流暢度,由此可見,圖書館獲取訓練數據集的質量高低將對虛擬數字人的交互效能帶來直接影響。
圖書館在構建虛擬數字人時獲得的讀者數據信息(如借閱歷史、咨詢記錄、交互數據、檢索習慣、身份信息等)尤其是未成年人的信息,對其做好安全防護尤為重要。數據如果泄露或不當利用,將會給讀者帶來不可預知的風險。因此數據保護計劃是否周密,能否合法合理地保護讀者數據,將持續影響著虛擬數字人構建前、構建中、構建后的圖書館服務評價。
22技術挑戰
由于AIGC技術還在不斷迭代,圖書館構建虛擬數字人的技術性問題始終存在。一是多模態技術的整合支持。語音識別在各種口音、語速或不同環境條件下的準確應用仍有局限;NLP技術在模糊語言、長對話、潛臺詞等方面的應用仍存在偏差或誤判;渲染算法應用于虛擬數字人的表現力和自然度還須進一步提升。二是語義理解的關聯支持。當前,虛擬數字人個性化服務應用還有不足,比如在特色館藏資源、特定專業服務上,面對讀者的多輪提問,其在上下文關聯回答上容易脫節;同時在面對專業交叉的問題時,其回答很容易失去準確性。三是沉浸式場景的適配協作。利用虛擬數字人營造沉浸式服務場景,其技術架構須能夠適配多種操作系統和硬件環境,以確保讀者體驗上的連續性,這涉及分布式存儲、數據一致性維護等復雜問題。四是運行系統的安全穩定。為避免虛擬數字人出現表達輸出錯誤、無故停止工作等問題,要加強容錯機制和自動恢復功能設計,這方面對團隊技術能力的要求較高。
23成本效益挑戰
虛擬數字人構建是一個長期、持續、動態投入和發展的過程,成本與效益問題必須直視。一是投入成本較高。構建虛擬數字人涉及技術開發、硬件采購和軟件購買,需要專業團隊與前沿信息技術的支持,包括人工智能模型訓練、知識庫構建、用戶界面設計等方面;虛擬數字人的運行需要強大的GPU服務器支撐,還需要實時語音識別、情感模擬或復雜數據處理等硬件設備,開發特色場景的虛擬數字人還須要處理方言識別、搭建特色資源庫。二是運行成本較大。圖書館要專門建立人才技術團隊,不斷修正算法錯誤,按時按需擴充知識庫,改進交互質量;動態更新系統安全,加強軟硬件升級,適應新技術發展;同時還要加強用戶培訓與推廣。三是服務優化時間較長。虛擬數字人建設是一個長期項目,可能短期內服務使用率和滿意度不能達到預期要求,尤其是老年人或兒童群體的體驗效益,短時間內無法量化評估,某些過于專精的問題可能超出虛擬數字人的知識庫范圍,影響其實用性。
24法律與責任風險
241知識產權問題
知識庫是圖書館虛擬數字人交互輸出的基礎,其中數字內容的授權路徑是不夠清晰的;在提升虛擬數字人的能力時,須采集公開互聯網數據或用戶交互數據,這些數據是否取得適當授權也是未知;此外,虛擬數字人在提供服務時會生成新的內容,此類生成內容的版權歸屬尚無定論[7]。
242算法不透明問題
在人機交互過程中,虛擬數字人一般只會給出最終回答,但其中的決策過程可能不會對讀者公開,這種算法黑箱化可能影響圖書館知識服務的權威性。如果虛擬數字人在法律、醫學等領域作出誤導性回答,給讀者的判斷帶來持續的錯誤影響,所造成的損失是由算法開發者、圖書館,還是虛擬數字人本身承擔,目前界定是不明確的。
243社會責任問題
虛擬數字人對設備硬件和技術軟件支持要求較高,對于部分經費相對有限的圖書館來說,引進此類服務有一定困難,且應用范圍較小,會導致服務出現不均等的狀況,這反而會加劇信息獲取的不平等,拉大數字鴻溝。同時,也可能導致部分讀者群體過度依賴虛擬數字人服務,忽視了提升自身數字素養的重要性,削弱了個人的創新能力。
3應對策略
31規范數據采集、處理和管理
311合法共享數據
圖書館可以基于現有館藏資源,搭建基礎知識庫。同時,與出版商、數據庫供應商簽訂授權協議,確保數據使用符合知識產權相關法律;加強對開放存取數據的獲取能力,通過圖書館聯盟構建共享數據池,鼓勵讀者貢獻知識內容,擴大可采用數據的范圍。
312建立數據清洗機制
使用數據清洗工具自動處理數據,結合人工審核,校正專業性數據;定期同步權威來源的最新數據,對超過有效期的信息進行標注和自動移除;引入讀者反饋機制,對報告錯誤的數據或不準確的回答及時改正。
313優化數據管理與存儲
建立統一的數據管理平臺,對不同來源的數據進行集中管理;通過分布式存儲系統管理海量數據,提升數據訪問速度和穩定性;通過壓縮技術降低存儲成本,優化數據檢索效率;有條件的圖書館可以將知識庫數據結構化為知識圖譜,明確實體及相應關系,結合AI算法實現語義搜索,對用戶提出的復雜問題作出精準回答。
32科學架構,優化算法
一是加強模塊化架構設計。采用模塊化和微服務架構,將虛擬數字人功能拆分為獨立模塊(如語音識別、知識檢索、情感計算等)并確保各模塊之間的接口標準化,提高系統擴展性和兼容性。利用云計算實現高效資源分配和彈性擴展,部署分布式存儲和計算架構,提升大規模數據處理和響應能力;對于高頻基礎功能,通過本地運行來提升響應速度;對于復雜計算(如深度學習模型推理),則借助云端處理以降低硬件成本和要求。
二是引入大語言模型(Large Language Model,LLM),優化自然語言處理算法,針對圖書館特色資源,對模型進行微調訓練,使其能解答讀者提出的專業問題;利用情感計算技術識別用戶語氣和情緒,打造更具親和力的交互體驗;優化對話管理算法,支持多輪上下文追蹤和邏輯推理,確保人機交互話題的連貫性和相關性。
三是使用統一的開發框架(如NET MAUI、Uno Platform)支持跨平臺應用開發,確保虛擬數字人在圖書館的移動端、桌面端和自助設備上有一致性體驗;通過標準化的API接口將虛擬數字人與圖書館其他系統(如借閱系統)集成。針對中小圖書館的低性能設備開發輕量化版本,提供基本功能,降低硬件需求。此外,還要加強無障礙設計,支持屏幕閱讀器、語音輸入等輔助功能,滿足殘障讀者的使用需求。
33資源共享,成本共擔
圖書館在構建虛擬數字人時,可以分級分階段上線,設計精簡、高效的功能模塊,降低一次性投入的成本,開發自身急需的服務場景,優先滿足目標讀者的功能需求。中小型圖書館可以在預算基礎上,積極尋求與更高層級的公共圖書館、高校圖書館或相關社會力量合作,優先采用成熟的市場解決方案,降低技術準入門檻,分攤成本投入;技術上可以借助云端可擴展的特性,降低本地硬件投入和運維成本。
圖書館機構應高度重視讀者信息反饋,通過大數據與人工智能技術對虛擬數字人服務進行持續的迭代優化,拓展虛擬數字人服務應用場景,提升讀者體驗的滿意度與忠誠度,實現經濟效益與社會效益的雙贏,推動虛擬數字人在提高圖書館文化服務水平上發揮更大作用。
34完善頂層設計,保障讀者權利
從法律和政策層面而言,相關部門應當精確界定虛擬數字人知識產權的歸屬界限與責任承擔機制,為圖書館虛擬數字人的合法合規使用提供法律依據。圖書館作為虛擬數字人技術的直接實踐者,也要制定詳盡、嚴謹、具有可操作性的倫理規范,邀請專家和讀者代表等第三方參與評估和監督,確保虛擬數字人使用的公開性、透明性。
從圖書館應用層面而言,圖書館要定期對模型和算法進行公平性測試,檢測其是否存在偏見或誤導性,在數據采集和模型訓練過程中要確保數據來源的多樣性和均衡性,避免系統性偏差。同時,公開虛擬數字人的工作原理,包括數據來源、算法邏輯和潛在局限性,確保推薦依據和決策過程公開透明。
從讀者層面而言,圖書館要在讀者首次使用虛擬數字人時,明確告知其能力范圍與局限性,避免讀者過分依賴其能力,產生不合理的預期。還要為讀者提供隱私保護選項,允許他們自行管理或刪除個人數據;提供“糾錯”功能,方便讀者可以主動標記虛擬數字人的錯誤回答,改進知識庫質量;暢通投訴渠道,接受并及時處理因系統錯誤或數據不準確引發的問題。
4結語
隨著AIGC技術的不斷進步與應用場景的不斷拓展,圖書館在虛擬數字人實踐應用上會產生更多的社會文化效益,虛擬數字人將成為圖書館在跨界合作上與其他行業深度融合的重要橋梁。綜上所述,圖書館要不斷加大基于AIGC技術應用虛擬數字人的關注力度,密切關注人工智能生成內容技術的發展趨勢,使虛擬數字人成為提升圖書館服務水平、助力圖書館轉型發展的重要驅動力。
參考文獻
[1]CSDN.AI Agent(智能體)行專題報告:從技術概念到場景落地[EB/OL].(2024-11-10)[2024-11-27].https://blog.csdn.net/v18165751604/article/det ails/143661000.
[2]鄭聰,柏雪,呂艷娥,等.數字人推動智慧圖書館創新發展:技術、優勢與實現路徑[J].新世紀圖書館,2024(9):61-67.
[3]黃麗.圖書館虛擬數字人的應用風險、治理困境及責任機制[J].數字圖書館論壇,2024(9):64-71.
[4]李雪慧,趙宇翔,張軒慧,等.公共文化服務場景下虛擬數字人的角色畫像與示能性設計[J].圖書館論壇,2025(2):51-61.
[5]陳依夢,彭忱.高校圖書館數字人文服務研究:必要性、可行性及策略[J].圖書情報導刊,2024(6):1-5.
[6]華院計算.虛擬數字人詳解|有個性、有情感的對話技術探索[EB/OL].(2023-07-21)[2024-11-27].https://blogcsdnnet/winnieg/article/detail s/131851360.
[7]蘆琦.虛擬數字人IP化法律問題及其知識產權保護應對[J].科技與法律(中英文),2023(3):57-67.
(編輯沈強)