陳小莉
關鍵詞:融合出版;古籍數字化;資源整合;信息融合;產業發展路徑
古籍是中華民族傳統文化的重要載體,傳承了華夏五千年的發展歷史,蘊含著獨特的歷史價值和豐富的文化價值,在傳承弘揚中華優秀傳統文化中發揮著不可替代的作用。本文中的古籍主要是指1912年以前在中國書寫或印刷的、具有中國古典裝訂形式的書籍。由于年代久遠,且受到自然和人為因素的損害,以紙張為主要載體的古籍存在發黃、變脆、蟲蝕、霉爛、粘連、酸化等諸多問題。這些問題不僅使古籍原件自身難以被使用,也為其保存與傳承帶來困難,因此,亟須解決古籍的開發利用與長期保護之間的矛盾。
隨著信息和網絡技術的飛速發展,人們的閱讀和信息消費習慣發生了巨大變化,紙媒媒介逐漸向融合文本、聲音、圖像和視頻等多媒體形式的數字化出版轉型。在這個背景下,古籍出版也迎來了向數字化出版轉型發展的重要機遇。在融合出版環境下,古籍數字化出版具有信息傳播的多模態性、同時性和瞬時性等優勢,它不僅能夠很大地減少古籍原件的利用次數,還有利于拓展古籍文化傳播范圍,提升信息可理解性、交互性、體驗性和趣味性。通過有效解決古籍保護與利用之間的矛盾,古籍數字化出版能夠更好地促進古籍文化深層次開發利用。
2022年4月,中共中央辦公廳、國務院辦公廳印發《關于推進新時代古籍工作的意見》(以下簡稱《意見》),要求提高古籍保護水平,挖掘古籍時代價值,加快古籍資源轉化利用,提出“推進古籍專業數據庫開發與利用”“積極開展古籍文本結構化、知識體系化、利用智能化的研究和實踐,加速推動古籍整理利用轉型升級”。如何貫徹落實《意見》精神,整合古籍內容和出版資源,創新古籍資源開發傳播形式,推進融合出版環境下古籍數字化出版,是每個古籍管理、出版單位都應思考和研究的時代課題。本文以融合出版環境下古籍數字化出版高效、健康、可持續發展為研究目標,結合中國書店出版社古籍數字化出版項目案例,研究了古籍數字化出版行業標準體系建設、古籍數字化處理加工、產業發展路徑,以及古籍數字資源協作建設、智能化深度開發和管理利用等問題。
一、融合出版環境下古籍數字化出版面臨的挑戰
我國古籍數字化工作起源于20世紀80年代,21世紀初以來,隨著計算機、人工智能等技術的飛速發展,古籍數字化及其出版問題倍受關注。諸多學者對古籍數字化出版的相關問題進行了有益的探索,如毛建軍、徐誠、范佳等研究了古籍數字化出版的理論建構、漢字處理、技術模式、產業鏈構建等問題,葉未央、德慶央珍研究了中醫、藏文等古籍數字化出版問題,雷玨瑩等、齊江蕾研究了數智時代古籍數字化再造邏輯與進路、古籍知識服務平臺發展策略等問題,但當下學界對融合出版環境下古籍數字化出版的研究幾近空白。由于缺乏針對性的專業理論指導和標準規范約束,融合出版環境下古籍數字化出版面臨著轉型發展的諸多挑戰。
(一)古籍數字化出版管理亟待規范
由于古籍數字化出版仍處于初級發展階段,圖書館、古籍數字資源開發商等機構數字化標準存在差異,導致數據庫質量良莠不齊、接口不一。各出版單位依托自身構建平臺,實施古籍內容數據和元數據采集、管理和開發,古籍數字化出版選題、制作、發布以及古籍版本選擇、語義解析、產品內容原創性和合規性等方面制度欠缺,需要從國家層面建立統一的、科學的、完善的古籍數字化管理標準。
(二)古籍數字化加工效能欠佳
受歷史條件制約和戰亂、自然災害等因素影響,部分古籍處于破損、發黃、變脆狀態,數字化工作計劃不周密、設備選擇不當、操作不慎等均易引起古籍原件受損。同時,古籍存在大量繁體字、異體字、通假字以及少數民族語言文字等,部分古籍以草書書寫,難以辨識,不同程度地影響著語義理解的準確性和文字自動識別轉換的準確率,這些都制約了古籍數字化效能。
(三)古籍數字資源建設存在壁壘
由于古籍是一種稀缺資源,各單位在管理古籍過程中始終保持謹慎態度,一些單位雖然在古籍數字化開發中投入大量的人力物力,但受到確保古籍資源安全性和其他因素的制約,古籍數字資源的傳播受到很大限制,數字資源的共享程度不夠高。同時,由于缺乏宏觀管理和統一規劃,各古籍管理單位開展古籍數字化工作各自為政,數字資源不完整不系統、數據格式不一、存儲管理平臺異構等問題較為常見,這給古籍資源整合和數據兼容帶來很大障礙。
(四)古籍數字化出版產品融合不夠
當前,古籍數字化出版在技術與出版的融合上整體水平不高,技術研發深度、技術服務廣度和業態創新力度還存在不少問題,古籍數字化出版產品較為普遍,以單一文本、版式電子書或掃描圖片形態存在,具備融合文本、聲音、視頻等內容于一體、閱讀體驗感強、推廣應用價值高的精品不多。由于計算機在自然語言處理、語義理解方面的技術尚未達到深度推廣應用水平,古籍數字資源內容融合的智能化處理效率還不夠高,古籍之間、所涉及歷史人物之間和事件之間等相互關聯關系有待進一步挖掘和深層次開發。
(五)古籍數字資源版權尚有爭議
雖然古籍形成于1912年以前,絕大多數古籍不存在著作權保護期限問題,但古籍整理研究者在改編、翻譯、注釋、整理古籍過程中存在智力創造行為,形成的新的作品是否應受到法律保護存在爭議,從而影響古籍數字化出版產品的傳播。2012年以來,已出現多起古籍著作權司法案件。例如,“廣東省立中山圖書館等與中國科技出版傳媒股份有限公司侵害出版者權糾紛案”涉及版式設計權、信息網絡傳播權保護問題。
(六)古籍數字化出版效益難以保障
我國現有古籍270余萬部、5000余萬冊,古籍數字化、深度開發、融合出版等需要大量資金投入,古籍收藏單位以事業機構為主,現有投資主要是科研項目資金,投資渠道單一、資金額度有限。多數古籍出版社的營銷平臺在文字、圖像、音視頻處理上專業能力不足,尚不具備匯聚、重組用戶提供內容的能力,古籍數字化出版的營利模式處在不斷探索之中,短時間內收支不平衡現象較為普遍,社會效益與經濟效益的評估、轉化缺乏操作性強的運行機制,如何提升投資效益、保證古籍數字化出版的可持續性發展面臨挑戰。
二、融合出版環境下古籍數字化出版的發展策略
(一)加強頂層設計,完善古籍數字化出版標準體系
積極適應新時代信息傳播格局和消費需求,深化古籍數字化出版的技術融合、信息模態融合和內容融合,圍繞資源、人才、技術、制度和數字基建等基礎支撐加強頂層設計。根據《2021-2035年國家古籍工作規劃》對古籍數字化、整理出版等工作部署要求,以提升傳播力為重點,對古籍管理、出版業務流程進行數字化重塑,打通古籍數字化出版選題、制作、運營鏈路,真正實現出版內容、生產模式、運作流程、傳播載體和閱讀消費形態的全面數字化。進一步完善古籍信息采集、資源描述、組織存儲以及融合出版環境下古籍數字化出版項目規劃、制作、發布、評價等相關標準,從內容制作、平臺建設、技術應用、產品運營等多個維度加強古籍數字化出版物的質量管控。
(二)堅持科學適用,優化古籍數字化處理加工
依據古籍著錄規則和數字化指南等標準規范,建設古籍目錄和全文數據庫。為減少數字化過程對古籍的影響,亦可采用縮微數字一體化技術,即對古籍進行一次信息采集,同時形成縮微影像和數字圖像,并通過目錄數據建立二者之間的關聯。在古籍掃描過程中,應當遵循保持原貌、清晰完整和不損害原件等原則,嚴格按照數字化前處理、掃描、圖像處理、質檢、數據掛接等流程開展數字化。掃描模式通常采用彩色模式,以便更好地展現古籍文字與載體原貌;掃描分辨率應能夠適應OCR轉換需求。對容易受損、不便掃描的古籍,亦可采用高拍儀進行數字化。為提升文字自動識別準確率,可成立由古籍研究專家、語言專家和信息處理專家組成的聯合攻關組,構建古體字與簡化字、少數民族語言文字與漢字的對照映射詞庫,以及古體詞句釋義詞典;對存在歧義、多義、同義的數字資源,增加語義解析、參照等標注類型元數據著錄,增強數據可理解性、可使用性。例如,正在制作的《中國書店藏珍貴古籍數據庫》第一輯,包括29種1300余卷人選國家珍貴古籍名錄的古籍(如表一所示),采用古籍數字化專用高精度掃描儀、零邊距檔案掃描系統、檔案數字化加工軟件等設備開展古籍掃描、數據處理加工工作,可實現古籍高清圖像在線查閱瀏覽。
(三)注重體系整合,開展古籍數字資源協作建設
古籍收藏單位可以通過統籌規劃、共同建設,跨單位、跨領域、跨平臺整合數字資源,實現資源互補、內容整合、優勢融合,積聚發布古籍數字化出版產品,最大限度地推廣利用古籍數字化成果。例如,中國書店出版社與山東孔子博物館協作開發的《孑L子圣跡圖匯編數據庫》項目,利用雙方在古籍資源收藏與集聚方面的優勢,選用MySQL數據庫存儲高清圖像數據,實施多維度詳細著錄,可實現內容數據和元數據的結構化存儲與管理。該項目首次將明代以來不同時期刊刻的60余種、9120幅各具特色的《孔子圣跡圖》整理成一個系統,并梳理了《孔子圣跡圖》的刊印、傳播、版本特點與發展歷史,為研究儒家文化傳播史、古代藝術史、刻印史等提供了極其珍貴的數字資源。
(四)聚焦信息融合,推動古籍數字資源深度開發
應用本體技術,構建人物、時間、歷史事件、地點等領域本體,設定自動推理規則,建立古籍資源中各類對象之間語義關聯和知識圖譜,實現古籍數字資源的知識組織、信息聚聯融合。應用多媒體處理、VR(虛擬現實)/AR(增強現實)制作等軟件,加強文本、聲音、圖像、視頻等多模態信息融合產品研發,綜合利用計算機圖形系統、三維建模和各種接口、傳感設備,產生可被用戶感知的三維空間虛擬世界(VR),并將古籍描述的歷史場景直接展現在現實世界中,實現與用戶交互(AR),增強沉浸式體驗感。例如,中國書店出版社《萬壽盛典圖》(數字解析版)項目,以清康熙五十六年(1717年)內府刻本為依據,通過對典籍的深度挖掘,利用UNITY開發平臺制作專題數字場館,以“視頻+解析”的形式,對1713年清朝臣民為康熙拜壽的盛典場景進行全方位展示,為人們了解當時北京的政治、經濟、地理、文化、社會生活等狀況,提供了直觀、形象的圖像資料。
(五)明晰權利責任,促進古籍數字資源管理利用
依據《中華人民共和國著作權法》及相關法律法規,注重古籍整理研究中的知識加工創造權益保護,明確古籍數字資源所有權、著作權、管理權、傳播權、利用權,探索古籍數字資源任務眾包式整理研究模式;應用云計算、大數據等技術,建構標準統一、多元共治的古籍數字資源長期保存平臺,對古籍數字資源實施全壽命資產化管理,實現古籍目錄和全文數字資源采集、整理、存儲、備份、檢測、轉換、遷移等功能,確保古籍數字資源真實性、完整性、可用性和安全性;統一建構古籍數字資源利用平臺,并與長期保存平臺邏輯隔離,根據著作權保護需要,制定實施有償授權訪問與免費訪問相結合的利用策略,推動古籍數字資源管理、共享加速發展。
(六)創新運營模式,拓寬古籍數字化出版產業發展之路
充分借鑒成功的網絡運營案例,探索應用具有引流功能的線上運營模式,精準響應用戶對文化生活數字化、個性化需求,推廣互動式、場景式傳播,打造古籍數字化出版新產品新服務,以內容新穎性、趣味性、體驗性提高點擊量、增加銷售量和廣告創收,不斷提升古籍數字化出版的運營能力。例如,人民文學出版社通過互聯網線上發售日本插畫家正子公也《三國志》數字藏品,60秒銷售額高達99.5萬元。
三、前景展望
從宏觀層面看,隨著國家對出版業和古籍工作的統籌調控,出版業轉型發展加速,古籍數字資源流轉共享壁壘不斷打破,跨單位、跨行業、跨模態整合古籍數字資源機制正在形成,古籍數字資源體系性、完整性、共享性不斷增強;古籍管理、出版業務數字化重塑加速推進,古籍資源管理單位協作高效,古籍出版單位與用戶之間反饋機制暢通,基于不同用戶需求的內容適配模式進入實踐應用,逐漸適應融合出版環境下用戶對古籍出版物的需求;具備內容制作、出版服務和用戶管理等多重功能的出版平臺逐步形成,與教育、旅游和休閑娛樂等產業深度融合,網站式導航、主題式展陳、場景式推介、點單式響應、嵌入式引導等消費模式靈活高效,古籍數字化產品消費生態可持續發展能力大幅提升,出版產業鏈走向成熟。
從技術層面看,古籍內容數據和屬性元數據標注自動化程度提升,檢索系統更加完備,“一站式”檢索、多模態全文語義查詢、語義關聯、可視化展現、增強式互動等逐步成為古籍數字化出版物的服務常態,繁體字、生僻字、通假字和少數民族語言文字等的釋義更加準確高效;人工智能技術廣泛應用,VR、AR、MR(混合現實)、語音識別、圖像識別、自然語言處理、機器深度學習等工具軟件在古籍智能化開發中的融合運用不斷推進,集文字、圖像、音頻、視頻等內容于一體的融合出版物占比提升,用戶沉浸式閱讀體驗感更為強烈;歷史場景重現、文化提煉等與時代元素緊密結合,古籍數字化出版物的文化傳承效能大幅躍升,對堅定文化自信、建設文化強國的貢獻率顯著增強。
四、結語
融合出版環境下的古籍數字化出版是出版新業態不可或缺的板塊。與傳統紙媒古籍出版物相比較,古籍數字化出版物便于攜帶、便于保管、便于共享,能夠同時提供形象生動的視聽信息,還可以通過觸覺產生互動,傳播速度快、范圍廣,極大增強用戶學習和娛樂的體驗感,為現代社會提供了多樣化的傳統文化學習和欣賞途徑。一部智能手機就可以方便地閱讀、觀看古籍數字化出版產品,用戶可以登錄統一的古籍數字資源網站,通過分類導航、主題搜索等方式查閱全國所有古籍資源;在歷史課堂、愛國主義教育基地、旅游景點、文化節、游戲場景等不同時機和場合,通過掃碼、傳感設備等方式途徑,用戶能置身歷史場景、與歷史人物交流;自然語言處理、知識圖譜構建等模型的適應性研究更為深入,集視覺、聽覺、觸覺、嗅覺于一體的融合體驗產品成為一個研究方向,高仿真古籍數字藏品也將受到更多人的關注和青睞。同時,古籍數字化出版物也為延長古籍壽命提供了解決方案,在最大限度保護原件的同時,可以讓更多的人參與古籍數字資源的整理研究,提升了古籍的開發利用效益,在保護和傳承古代文化遺產方面發揮著重要作用。