摘 要:人工智能技術的發展推動了圖書館古籍智慧化服務的開展。文章分析了圖書館古籍智慧化服務存在的問題,提出了利用人工智能技術對古籍進行智能化加工、提升古籍智慧化服務效能、推動實現古籍的活化利用及加大古籍共建共享力度等圖書館古籍智慧化服務策略,以期圖書館能有效活化利用館藏古籍資源,大力開展古籍智慧化服務,傳承和弘揚中華優秀傳統文化。
關鍵詞:人工智能;圖書館;古籍智慧化服務
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2025)01-0106-03
1 背景
自2007年我國實施“中華古籍保護計劃”以來,全國各級圖書館、博物館、高校等機構大力開展古籍普查登記、修復、借閱、數字化閱讀、宣傳推廣等工作,取得了顯著的工作成效。中共中央辦公廳、國務院辦公廳于2022年4月印發《關于推進新時代古籍工作的意見》,要求統籌實施國家古籍數字化工程,并積極開展古籍文本結構化、知識體系化、利用智能化的研究和實踐,加速推動古籍整理利用轉型升級[1]。近年來,以深度學習、自然語言處理、大語言模型等為代表的人工智能技術快速發展,逐漸推動各行各業的智能化轉型升級。在此背景下,我國圖書館應積極接受和利用人工智能技術,在OCR識別、自動標點、實體識別等方面提高古籍智能化加工水平,開展古籍智慧化服務,提升古籍資源加工和服務效能。
2 圖書館古籍智慧化服務存在的問題
2. 1 沒有統一古籍數字資源建設標準
我國現有的古籍數據庫沒有遵循統一的技術和知識加工規范,不同數據庫在知識標注、資源展示和資源檢索等方面存在明顯差異,服務質量參差不齊。隨著相關數據庫及服務平臺數量的不斷增多,古籍數字資源建設標準缺失的問題逐漸凸顯,既不利于讀者快速檢索所需的古籍資源,也不利于圖書館共享古籍資源[2]。
2. 2 古籍數字化加工能力不強
目前,圖書館主要以影像文件的形式加工古籍資源,不僅難以滿足讀者的全文檢索、閱讀需求,還難以進一步對古籍進行文本分析、知識抽取等深度挖掘與利用。此外,現有的古籍智能化加工平臺普遍存在文本識別準確率不高、古籍知識的細顆粒標引不夠深入、校勘和整理深度不夠等問題,導致數字化古籍資源的利用價值大打折扣[3]。
2. 3 服務效能有待提升
目前,圖書館的古籍智慧化服務形式仍以資源閱讀為主,資源分散,檢索渠道單一,僅能為讀者提供原文展示服務,不注重場景化、知識化服務的開展,不利于讀者理解古籍內容,服務效能不高[4]。
3 人工智能驅動下的圖書館古籍智慧化服務策略
3. 1 利用人工智能技術對古籍進行智能化加工
3. 1. 1 文本識別。圖書館應利用深度學習技術,提高古籍OCR文本識別的準確率,特別是對繁體字、生僻字、異體字、通假字、避諱字的識別準確率,有效識別古籍的標題、段落、注釋、圖像、印章等元素,并對古籍的版面進行分析,為后續的文本處理和版式還原奠定基礎。
3. 1. 2 知識加工。圖書館應利用自然語言處理技術,對古籍進行細顆粒知識自動標引、自動抽取等處理,如:從古籍全文中抽取目錄數據,生成三級目錄標引;抽取古籍中的引文、注釋、附錄等,方便讀者理解古籍內容;抽取古籍中的人名、地名、事件、事物、典故、機構等,分析這些內容的語義關系,構建古籍知識庫;抽取古籍中的文本、圖像等,利用生成式人工智能技術生成古籍多模態知識數據。
3. 2 提升古籍智慧化服務效能
3. 2. 1 開展一站式知識獲取服務。圖書館應積極整合古籍相關的元數據、影像數據、文本數據、多模態數據、知識數據等,建設古籍數據庫及智慧化服務平臺,為讀者提供古籍資源的一站式檢索、分類導航、元數據揭示、全文閱讀、細顆粒度知識揭示等一站式知識獲取服務。
3. 2. 2 開展古籍文本分析服務。圖書館應根據古籍文本無標點、晦澀難懂等特點,為讀者提供古籍斷句與標點、字體轉換、知識注解、情感分析等文本分析服務,為讀者順利閱讀古籍提供便利。此外,圖書館還應分析古籍的版本、作者、成書背景等信息,揭示不同版本古籍之間的差異及存在差異的原因,幫助讀者準確了解古籍的內容和價值。
3. 2. 3 提供基于自然語言交互的智能設備。圖書館應為讀者提供基于自然語言交互的智能設備,依托智能設備開展古籍全文檢索、知識問答、來源回溯、知識百科等服務,為讀者閱讀古籍提供便利。此外,圖書館還應利用檢索增強生成技術開展提問式語義檢索服務,即通過智能設備收集和分析讀者提出的問題,利用大語言模型對相關問題和信息進行總結,快速解答讀者提問。
3. 3 推動實現古籍的活化利用
3. 3. 1 開發優質數字人文產品。圖書館應積極開發優質古籍數字人文產品,如:利用地理信息系統技術,生成古籍相關的地圖、人物形跡圖、文獻分布圖等數字人文產品;利用人工智能技術提取古籍知識元素,生成人物關系圖譜、人物形跡圖譜、社會關系網絡圖譜等數字人文產品。
3. 3. 2 創新古籍活化產品宣傳推廣方式。圖書館應利用虛擬現實、沉浸式參與、人機交互、智能傳播等技術,創新古籍活化產品宣傳推廣方式,加大古籍活化產品宣傳推廣力度,引導讀者樹立古籍保護意識,如:國家圖書館利用全景視頻拍攝、三維動畫制作等技術拍攝制作了《永樂大典》VR資源,全景再現了《永樂大典》的成書過程及歷史變遷[5],受到讀者的廣泛關注。
3. 4 加大古籍共建共享力度
3. 4. 1 統一古籍數字資源建設標準。有關部門應統一古籍數字資源建設標準,包括元數據建設標準、影像數據掃描標準、知識數據加工標準等,正確指導圖書館開展標準化的古籍數字資源建設工作,為圖書館古籍資源的共建共享奠定基礎。
3. 4. 2 合作建設古籍資源及服務平臺。圖書館應積極與相關機構合作,共同建設全國古籍大數據平臺,對古籍資源進行統一登記,并整合古籍文獻的存藏流轉、版本沿革、出版再造等數據信息;建設古籍智能化加工平臺,以云租用的方式為地方圖書館,特別是技術水平不高的中小型圖書館提供OCR文本識別、命名實體識別、自動斷句、自動標點、自動翻譯、自動分類索引等智能化古籍文本加工服務;建設全國圖書館古籍智慧化服務平臺,整合和揭示全國圖書館的古籍知識數據,形成服務合力,提升服務效能。
4 結語
近年來,我國圖書館在古籍數字化加工、智能化整理、智慧化服務等方面取得了一定的成就,積累了大量數字影像和文本內容,為讀者提供了資源導航、資源檢索、全文閱讀、知識圖譜、個性化推薦等古籍智慧化服務,在一定程度上滿足了讀者的閱讀需求。人工智能驅動背景下,圖書館應積極探索新興技術在古籍資源建設及活化利用方面的應用方法,為讀者提供古籍知識的自動化聚合揭示、語義化檢索、智能化問答等服務,為讀者閱讀和理解古籍內容提供便利,推廣和傳承中華優秀傳統文化。
參考文獻:
[1] 中共中央辦公廳國務院辦公廳印發《關于推進新時代古籍工作的意見》[EB/ OL]. [2024-11-18]. https:/ / www. gov. cn/ zhengce/2022-04/11/ content_5684555. htm.
[2] 劉煒,葉鷹.數字人文的技術體系與理論結構探討[J].中國圖書館學報,2017(5):32-41.
[3] 王秋云,龍歡.我國古籍領域開展數字人文研究與實踐現狀分析[J].圖書館界,2023(4):19-25.
[4] 王昊,王蕾.中華古籍活化的實踐框架與發展路徑[J].中國圖書館學報,2024(4):4-20.
[5] 周笑盈.國家圖書館“《永樂大典》VR全景文化典籍”實踐探索:虛擬現實賦能圖書館沉浸式閱讀推廣的創新路徑[J].國家圖書館學刊,2022(6):80-89.
(編校:馮耕)