【摘 要】中華古籍資源散布在全球各地,若能聯(lián)合多方主體力量,通過數(shù)字化方式對其進行整合加工,有助于促進國際間的文化交流,大大提高古籍利用率,發(fā)揮其在全球文明建設(shè)中的重要作用?;诜?wù)生態(tài)系統(tǒng)理論,考察中華古籍?dāng)?shù)字化國際合作的主要驅(qū)動因素,從宏觀、中觀和微觀等不同層面剖析多元主體互動結(jié)構(gòu),進而提出從典藏機構(gòu)間“一對一”合作模式轉(zhuǎn)向多元主體協(xié)作模式、從相對封閉的古籍語料庫構(gòu)建模式轉(zhuǎn)向更加開放的數(shù)據(jù)流通模式、從基礎(chǔ)的數(shù)據(jù)庫服務(wù)模式轉(zhuǎn)向體系化的綜合性古籍知識服務(wù)模式等建議。
【關(guān)" 鍵" 詞】中華古籍?dāng)?shù)字化;國際合作;驅(qū)動因素;主體結(jié)構(gòu);發(fā)展模式
【作者單位】章萌,北京印刷學(xué)院出版學(xué)院。
【基金項目】北京市教委社科計劃一般項目“服務(wù)生態(tài)系統(tǒng)視角下中文古籍?dāng)?shù)字出版的國際合作模式研究”(SM202410015002);北京出版集團委托橫向課題“書香京城—全民閱讀數(shù)字平臺(一期)( HXDK2024314)。
【中圖分類號】G239.15 【文獻標(biāo)志碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.10.008
中華古籍作為中華民族優(yōu)秀典籍傳承的載體,流散在國外的古籍善本數(shù)量龐大,種類繁多[1],通過數(shù)字化方式進行虛擬性回歸,是海外中華古籍回歸的大趨勢。不過,由于不同國家和地區(qū)缺乏統(tǒng)一的古籍著錄標(biāo)準(zhǔn)和文獻分類方法,加上技術(shù)水平和需求條件等各異,亟須取長補短,協(xié)同開展中華古籍?dāng)?shù)字化工作,構(gòu)建可持續(xù)的國際合作模式。
本文所指的中華古籍包括1911年辛亥革命以前,以及1911年至1949年間在中國編撰的、具有重要歷史文化研究意義的文獻[2]。古籍?dāng)?shù)字化是指利用數(shù)字技術(shù)對現(xiàn)存古籍進行再現(xiàn)和加工,將常見的語言文字或圖形符號轉(zhuǎn)化為能被計算機識別的數(shù)字符號,形成古籍文獻書目數(shù)據(jù)庫、古籍全文數(shù)據(jù)庫等,以達到利用和保護古籍的目的[3]。
服務(wù)生態(tài)系統(tǒng)理論強調(diào)服務(wù)主導(dǎo)邏輯而非傳統(tǒng)商品主導(dǎo)邏輯,不僅關(guān)注實現(xiàn)組織自身和合作伙伴的利益,也關(guān)注所有參與者利益,以促進服務(wù)生態(tài)系統(tǒng)持續(xù)健康發(fā)展。中華古籍?dāng)?shù)字化是促進人類文明傳承共享與世界各國文化產(chǎn)業(yè)發(fā)展的重要工作,追求所有參與者的共同利益,以實現(xiàn)共建共享?;诜?wù)生態(tài)系統(tǒng)理論,中華古籍?dāng)?shù)字化國際合作主體在制度環(huán)境、技術(shù)條件、用戶需求等因素驅(qū)動下可形成多元主體結(jié)構(gòu),通過資源整合、服務(wù)交換和數(shù)字技術(shù)研發(fā)等活動構(gòu)建價值共創(chuàng)模式。
一、中華古籍?dāng)?shù)字化國際合作的驅(qū)動因素
本文通過考察海內(nèi)外相關(guān)國家、地區(qū)在古籍?dāng)?shù)字化方面的制度環(huán)境支持狀況,探究國內(nèi)外先進的古籍?dāng)?shù)字化技術(shù)條件和用戶需求情況,厘清環(huán)境動因,為分析主體結(jié)構(gòu)和行為模式奠定基礎(chǔ)。
1.倡導(dǎo)全球文獻資源共享和文化遺產(chǎn)保護的制度環(huán)境
中華古籍?dāng)?shù)字化工作是否與海內(nèi)外相關(guān)主體所處制度環(huán)境相契合,決定了國際合作生態(tài)系統(tǒng)能否持續(xù)運行。
一方面,中華古籍作為一種文獻資源,其數(shù)字化國際合作是建立在絕大部分國家、地區(qū)對于全球文獻資源共享這一原則的基本遵循之上的。雖然圖書館、出版社等文化機構(gòu)在提供信息方面發(fā)揮了重要作用,但沒有任何一家館藏機構(gòu)擁有用戶所需的全部信息,因此跨國界的文獻資源共享十分必要。部分國際組織在這方面發(fā)揮了積極作用,如國際圖聯(lián)(IFLA)文獻傳遞與資源共享委員會發(fā)起的“新冠肺炎疫情期間及以后加強數(shù)字資源共享”(HERMES)計劃,已經(jīng)推動30多個國家的圖書館參與當(dāng)?shù)睾蛧H開放資源共享實踐[4]。
另一方面,大量珍貴的中華古籍是對中國乃至全人類都有重要歷史學(xué)術(shù)研究價值的文化遺產(chǎn),其中部分中華古籍已被聯(lián)合國教科文組織列入《世界記憶(國際)名錄》,提高了各國對保護、利用中華典籍的統(tǒng)一認(rèn)識。在“世界記憶計劃”框架下,部分國家已制定文獻遺產(chǎn)藏品開發(fā)、保存和獲取政策。此外,2015年聯(lián)合國教科文組織通過的《關(guān)于保存和獲取包括數(shù)字遺產(chǎn)在內(nèi)的文獻遺產(chǎn)的建議書》,也要求會員國竭盡所能,采取一切適當(dāng)措施保護本國文獻遺產(chǎn),并鼓勵會員國參與國際合作,用數(shù)字化等方式保護瀕危文獻遺產(chǎn)[5]。在該框架下,眾多會員國積極參與文獻遺產(chǎn)保護與數(shù)字化利用工作。
2.具備支持跨國協(xié)作的古籍?dāng)?shù)字化技術(shù)條件
目前,中國已經(jīng)能夠運用自然語言處理技術(shù)開展資源識別、文本基礎(chǔ)性加工、知識元標(biāo)引與知識挖掘等中華古籍?dāng)?shù)字化基礎(chǔ)性工作。不過,由于國內(nèi)外缺乏大規(guī)模、高質(zhì)量、深度標(biāo)注的古籍語料庫,特別是古今漢語平行語料庫,從而影響了模型訓(xùn)練效果,亟須各國協(xié)同搭建相關(guān)高質(zhì)量語料庫[6]。
實際上,國際范圍內(nèi)已具備大規(guī)模語料庫跨國協(xié)同操作的基礎(chǔ)技術(shù)條件。如在構(gòu)建公共語料庫方面,歐洲文化遺產(chǎn)協(xié)作云(ECCCH)作為歐盟委員會數(shù)字人文基礎(chǔ)設(shè)施,能夠基于多模態(tài)古籍文獻數(shù)據(jù),使用語義技術(shù)生成可擴展的數(shù)據(jù)模型和存儲庫,分析不同國家和機構(gòu)的相關(guān)數(shù)據(jù)存檔監(jiān)管報告和歸檔義務(wù),實現(xiàn)了各地存儲庫的互聯(lián)互通,并盡可能實現(xiàn)半自動化等[7],為構(gòu)建全球中華古籍?dāng)?shù)字化公共語料庫提供了多模態(tài)技術(shù)協(xié)同與AI驅(qū)動的技術(shù)范式。在技術(shù)標(biāo)準(zhǔn)方面,國際上目前已經(jīng)形成通用的資源描述與檢索的編目標(biāo)準(zhǔn)RDA、國際圖像互操作框架IIIF、資源描述的通用數(shù)據(jù)框架RDF等規(guī)范,以滿足數(shù)字環(huán)境下各國古籍資源著錄、檢索、存儲、共享等要求。這些都為各國協(xié)同搭建古籍語料庫提供了有力的技術(shù)支持。
3.滿足典藏保護、學(xué)術(shù)研究與文化教育的多元化用戶需求
由于國際范圍內(nèi)用戶群體的不同,古籍資源庫等數(shù)字化產(chǎn)品需要滿足的用戶需求主要包括以下三類。
一是典藏單位人員的文化保存需求。圖書館等古籍典藏單位人員通常要基于大規(guī)模古籍等文獻資源,開展信息采集、編目、加工、保存與修復(fù)等工作,在古籍圖像資源精準(zhǔn)識別、智能編目與內(nèi)容自動分類等方面具有較高的技術(shù)服務(wù)需求,為此,亟須引入高質(zhì)量的深度學(xué)習(xí)模型以提升工作效率。
二是研究人員的學(xué)術(shù)研究需求。國外從事漢學(xué)研究的學(xué)者通常將域外漢籍作為最基礎(chǔ)的文獻支撐,國內(nèi)從事古籍整理、中國古代文學(xué)等領(lǐng)域研究的人員也需要以大量可靠的古籍資料為基礎(chǔ)。這些學(xué)者出于研究目的,往往需要通過全面的文獻集成服務(wù)來實現(xiàn)“廣羅異本”,通過細(xì)致的古籍自動??薄⒆⑨尅⒈?zhèn)闻c輯佚服務(wù)來實現(xiàn)“求是”與“會通”,通過深度知識挖掘服務(wù)來實現(xiàn)“辨章學(xué)術(shù)、考鏡源流”的目的[8]。
三是一般民眾的教育學(xué)習(xí)需求。從國際范圍來看,普通用戶往往是中華古籍的愛好者或者傳統(tǒng)文化教育者,他們傾向于閱讀經(jīng)典善本古籍,重視內(nèi)容資源的可讀性與生動性,對自動翻譯、知識可視化等多元化信息服務(wù)的需求較強。
二、中華古籍?dāng)?shù)字化國際合作的主體結(jié)構(gòu)
中華古籍?dāng)?shù)字化國際合作主體由微觀層、中觀層、宏觀層構(gòu)成。微觀層是圖書館、互聯(lián)網(wǎng)公司等機構(gòu)與用戶二元互動的結(jié)構(gòu);中觀層是海內(nèi)外高校、圖書館、出版社、技術(shù)公司等利益相關(guān)者多元互動結(jié)構(gòu),宏觀層則是涉及政府部門、基金組織等廣泛社會經(jīng)濟參與者的互動結(jié)構(gòu)。厘清多層次互動結(jié)構(gòu)可為進一步分析參與者的行為模式奠定基礎(chǔ)。
1.圖書館、互聯(lián)網(wǎng)公司等機構(gòu)與用戶二元互動的結(jié)構(gòu)
圖書館或技術(shù)公司等機構(gòu)通常作為搭建古籍文獻資源平臺的主體,為典藏單位人員、教學(xué)科研人員、學(xué)生和普通民眾等用戶提供便利的資源服務(wù)。海內(nèi)外多數(shù)收錄中華古籍?dāng)?shù)字資源的平臺,都能針對國際范圍內(nèi)研究使用者的需求來優(yōu)化其資源庫內(nèi)容的組織方式、網(wǎng)站內(nèi)容授權(quán)制度、影像圖片分辨率和檢索功能等,以保證資源的可獲得性與可解讀性。如:加州大學(xué)本部圖書館的中文善本特藏數(shù)字館藏,不僅可供世界范圍內(nèi)的研究人員自由開放使用,讓用戶免費下載古籍文獻影像內(nèi)容PDF文件,而且提供MARC21等機讀目錄國際標(biāo)準(zhǔn)著錄格式信息,以及BibTeX、RefWorks、RIS等多種文獻管理格式信息,有利于館際資源共享與研究者跨平臺使用文獻;哈佛大學(xué)燕京圖書館的中文善本特藏、中國海事資料、中國古地名詞典等數(shù)字館藏均采取開放存取模式,供全球公眾免費閱讀。
2.海內(nèi)外圖書館、出版社、技術(shù)公司等利益相關(guān)者多元互動結(jié)構(gòu)
中國的圖書館、出版單位、高校、技術(shù)公司等機構(gòu)在參與國際合作過程中,通常以數(shù)字化經(jīng)驗和技術(shù)與國外機構(gòu)進行合作,并以數(shù)字化方式取得復(fù)制品及其使用權(quán)利,達到合作發(fā)展、資源共享的目的。
中國國家圖書館作為國內(nèi)開展中華古籍?dāng)?shù)字化國際合作的引領(lǐng)者,主要承擔(dān)古籍?dāng)?shù)字化文獻數(shù)據(jù)庫創(chuàng)建、維護與數(shù)據(jù)質(zhì)量控制等工作。如在與日本東洋文化研究所合作過程中,中國國家圖書館負(fù)責(zé)創(chuàng)建與維護“東京大學(xué)東洋文化研究所漢籍全文影像數(shù)據(jù)庫”,為國際范圍內(nèi)的讀者提供免費的學(xué)術(shù)研究參考。
眾多出版單位也致力于海外中華古籍普查與整理工作,具體包括編纂海外古籍收藏目錄,匯編散藏海外的珍貴典籍叢書,以及建設(shè)海外古籍專題數(shù)據(jù)庫等。如中華書局影印出版了著名醫(yī)史文獻專家鄭金生主編的《海外中醫(yī)珍善本古籍叢刊》,古聯(lián)(北京)數(shù)字傳媒科技有限公司通過對其進行數(shù)字化加工,形成專題數(shù)據(jù)庫“海外中醫(yī)古籍庫”。
一些互聯(lián)網(wǎng)企業(yè)、高校等紛紛發(fā)揮其技術(shù)、科研等優(yōu)勢,參與到海外古籍的數(shù)字化回歸工作中。如在“漢典重光”古籍?dāng)?shù)據(jù)平臺建設(shè)項目中,阿里巴巴達摩院、四川大學(xué)等單位聯(lián)合尋覓流散海外的中國古籍,與海外機構(gòu)開展合作。項目由加州大學(xué)伯克利分校提供所藏中華古籍的掃描圖片和編目數(shù)據(jù),達摩院技術(shù)團隊與四川大學(xué)專家聯(lián)合進行數(shù)字化加工和平臺發(fā)布工作等。這種數(shù)字人文資源平臺建設(shè)模式,有助于推動全球范圍內(nèi)漢學(xué)、歷史學(xué)等領(lǐng)域?qū)W術(shù)研究的進步,實現(xiàn)海內(nèi)外高校、圖書館、技術(shù)公司的共同愿景。
3.涉及政府部門、基金組織等廣泛社會經(jīng)濟參與者的互動結(jié)構(gòu)
政府部門在中華古籍?dāng)?shù)字化工作中始終發(fā)揮著重要的作用。自我國2007年初正式啟動“中華古籍保護計劃”以來,眾多機構(gòu)積極響應(yīng),開展古籍普查、聯(lián)合目錄構(gòu)建、古籍?dāng)?shù)字資源庫建設(shè)等工作。其中,中國國家圖書館于2015年啟動“海外中華古籍調(diào)查暨數(shù)字化合作項目”,主持建設(shè)“中華古籍善本國際聯(lián)合書目系統(tǒng)”,已累計錄入30余家海內(nèi)外圖書館所藏3481種古籍善本[9]。
一些基金組織為中華古籍?dāng)?shù)字化工作提供了重要資金支持。如大英圖書館發(fā)起的“國際敦煌項目”作為全球所藏敦煌和絲綢之路文獻數(shù)字化的國際合作項目,絕大部分職員薪水、設(shè)備、教育項目、會議等方面的花銷都依靠外部基金支持。其中,英國中英友好信托基金(SBFT)從1997年開始,為前往大英圖書館整理所藏敦煌遺書等文獻的中國學(xué)者與修復(fù)保護專家提供差旅補助,一直持續(xù)至今。正是有這些基金組織的支持,各國參與機構(gòu)才能持續(xù)開展本地所藏敦煌文獻的數(shù)字化與保護,使全球研究人員受益。
三、中華古籍?dāng)?shù)字化國際合作模式發(fā)展建議
在制度環(huán)境、技術(shù)條件和用戶需求的驅(qū)動下,國際范圍內(nèi)諸多主體機構(gòu)通過資源整合、服務(wù)交換和數(shù)字技術(shù)研發(fā)等方式參與中華古籍?dāng)?shù)字化工作。當(dāng)前的國際合作主要由中國提供專業(yè)人力、資金等資源,在國外的數(shù)字資源和關(guān)聯(lián)數(shù)據(jù)庫技術(shù)等支持下展開,尚未形成成熟的國際合作模式[10]。本研究基于服務(wù)生態(tài)系統(tǒng)理論視角,立足于構(gòu)建資源共享、價值共創(chuàng)的中華古籍?dāng)?shù)字化生態(tài),提出以下國際合作模式發(fā)展建議,以為相關(guān)政府部門、館藏單位、出版社和技術(shù)公司等提供參考。
1.從典藏機構(gòu)間“一對一”合作轉(zhuǎn)向多元主體協(xié)作
當(dāng)前,部分典藏機構(gòu)出于資源整合與服務(wù)交換目的,初步形成了“一對一”的國際合作發(fā)展模式,其中以中國國家圖書館承擔(dān)建設(shè)的東京大學(xué)東洋文化研究所漢籍全文影像數(shù)據(jù)庫為代表。這種模式通常由國內(nèi)機構(gòu)提供資金、技術(shù)、人力等支持,國外典藏單位提供中華古籍的掃描圖片和編目數(shù)據(jù)等,雙方共同完成古籍?dāng)?shù)字化工作,共享數(shù)字資源。然而,僅靠少數(shù)機構(gòu)打造的古籍文獻庫等數(shù)字化產(chǎn)品,在資源規(guī)模、內(nèi)容類型與服務(wù)方式等方面都存在局限性,只有運用統(tǒng)一的制度規(guī)范與技術(shù)等操作性資源,匯聚高校、圖書館、出版社、技術(shù)公司等多元主體力量,促使參與者共同更新制度,引進新的參與者,產(chǎn)出更多價值共創(chuàng)成果,才能實現(xiàn)價值最大化。因此,中華古籍?dāng)?shù)字化工作不應(yīng)局限于典藏機構(gòu)間“一對一”的合作模式,而應(yīng)從以下三個層面逐步構(gòu)建更加高效的多元主體協(xié)作模式。
一是在國家層面健全中華古籍?dāng)?shù)字化分工合作機制。目前,國內(nèi)已在國家新聞出版署、文化和旅游部、教育部等主導(dǎo)下,形成由中國國家圖書館、全國高等院校古籍整理研究工作委員會等事業(yè)單位發(fā)動,各館藏單位、高校、科研院所、出版社等執(zhí)行的全國性合作聯(lián)盟網(wǎng)絡(luò)。不同聯(lián)盟參與主體應(yīng)結(jié)合古籍?dāng)?shù)字化產(chǎn)業(yè)鏈各環(huán)節(jié)要求和自身特色明確主攻方向,進行專業(yè)分工與整合。
中華古籍?dāng)?shù)字化產(chǎn)業(yè)鏈上游環(huán)節(jié)主要包括數(shù)字化項目規(guī)劃和內(nèi)容選擇等活動,政府部門作為古籍?dāng)?shù)字化項目規(guī)劃工作主體,應(yīng)加強協(xié)調(diào)各方合作關(guān)系,通過設(shè)立中宣部、文化和旅游部、教育部等相關(guān)部委的聯(lián)席會議等方式,將各部委原有相關(guān)平臺歸口統(tǒng)一到指定平臺上[11]。同時,深入開展用戶需求、古籍資源存藏情況等調(diào)研工作,以此為基礎(chǔ)識別并分析可實施的重點工程項目。圖書館、出版社等古籍資源存藏與整理機構(gòu)應(yīng)承擔(dān)數(shù)字化內(nèi)容選擇環(huán)節(jié)工作,從文化傳承、文獻特色與資源可獲取性等角度考慮,選取適宜進行數(shù)字化開發(fā)的古籍內(nèi)容和版本。
中華古籍?dāng)?shù)字化產(chǎn)業(yè)鏈中游涉及政府部門、高校、科研院所、行業(yè)組織等主體,主要包括數(shù)字化內(nèi)容組織與保存環(huán)節(jié)。當(dāng)前,由于國內(nèi)缺乏統(tǒng)一完善的古籍?dāng)?shù)字化標(biāo)準(zhǔn)體系,嚴(yán)重制約了數(shù)字化內(nèi)容組織與保存活動的順利開展。建議在國家標(biāo)準(zhǔn)化管理委員會指導(dǎo)下,由新聞出版、檔案、文物等主管部門牽頭,聯(lián)合高校、科研院所等多方力量,借鑒國外實行的國際圖像互操作框架IIIF、資源描述與檢索編目標(biāo)準(zhǔn)RDA等規(guī)范,以及中國國家圖書館、中國出版集團等先進單位的實踐經(jīng)驗,共同健全古籍?dāng)?shù)字化在圖像采集、元數(shù)據(jù)制作、語義關(guān)聯(lián)、長期保存等方面的國家標(biāo)準(zhǔn)。同時,設(shè)置管理監(jiān)督辦法,保障各主體嚴(yán)格遵循統(tǒng)一標(biāo)準(zhǔn),確保流程化、規(guī)范化操作。
中華古籍?dāng)?shù)字化產(chǎn)業(yè)鏈下游環(huán)節(jié)主要涉及數(shù)字化應(yīng)用活動,包括實現(xiàn)古籍的檢索、共享、知識服務(wù)等功能。該環(huán)節(jié)不僅需要技術(shù)公司提供先進的數(shù)字化技術(shù)和工具,加強對古籍知識的深度開發(fā)和增值利用,而且需要與圖書館、博物館等機構(gòu)合作共享資源和技術(shù),開發(fā)相關(guān)應(yīng)用和產(chǎn)品。此外,還應(yīng)倡導(dǎo)社會組織、學(xué)術(shù)機構(gòu)、志愿者等社會力量參與古籍?dāng)?shù)字化的宣傳推廣活動,提高公眾對該項工作的認(rèn)知和關(guān)注度。
二是在區(qū)域?qū)用嬉劳小耙粠б宦贰钡群献骺蚣?,建立統(tǒng)一的中華古籍?dāng)?shù)字化平臺,匯聚各機構(gòu)的古籍資源,實現(xiàn)開放共享。在平臺建設(shè)初期,建議聯(lián)合越南、蒙古、俄羅斯等在漢學(xué)研究、古籍收藏方面有較好基礎(chǔ)的國家,依托各國財政支持,并積極尋求海內(nèi)外文化、教育、出版等領(lǐng)域的企業(yè)贊助,通過專項資金和公益基金等形式保障平臺基礎(chǔ)設(shè)施建設(shè)和基本運維,確保古籍目錄、書影及部分文本的免費開放,以滿足公眾文化需求。同時,建議各國成立聯(lián)合項目組共同制定規(guī)劃,采用中國《古籍印刷通用字規(guī)范字形表》(GB/Z 40637-2021)國家標(biāo)準(zhǔn)等,形成區(qū)域內(nèi)的統(tǒng)一標(biāo)準(zhǔn)體系,共同參與館藏中華古籍?dāng)?shù)字化對象的遴選和平臺建設(shè)的規(guī)范化工作。
當(dāng)平臺進入穩(wěn)定運營階段,應(yīng)逐步引入商業(yè)化運作模式。為推動該模式的實施,可建立古籍內(nèi)容資源分級開放策略:如對于古籍目錄、低精度書影、已進入公有領(lǐng)域的古籍文本等,可在數(shù)字化平臺完全開放;對于高精度古籍圖像、未經(jīng)校對的原始OCR文本、特定機構(gòu)的珍貴資源等,可采取受限開放方式,用戶注冊后可獲取免費內(nèi)容;對于最新的學(xué)術(shù)注釋、深度整理的古籍?dāng)?shù)據(jù)庫等,可實行授權(quán)訪問措施,并將其聯(lián)同高階數(shù)字人文工具包、會員訂閱等作為付費增值服務(wù),以確保平臺可持續(xù)發(fā)展。
三是在國際層面針對特定主題的中華古籍,可聯(lián)合全球藏有相關(guān)資源的機構(gòu)開展專題性數(shù)字化項目建設(shè)。中國作為中華古籍的發(fā)源地,應(yīng)在國際范圍內(nèi)大力推廣自身所積累的古籍?dāng)?shù)字化實踐經(jīng)驗,積極承擔(dān)項目主要工作。全國古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組印發(fā)的《2021—2035國家古籍工作規(guī)劃》指出,要“結(jié)合學(xué)術(shù)文化發(fā)展需要,分領(lǐng)域、分專題推進集成性古籍資源庫建設(shè),重點建設(shè)古代文學(xué)、歷史文獻、寫本文獻等專題數(shù)據(jù)庫”[12]。而大多數(shù)專題的中華古籍資源散佚在全球各地,為此亟須整合,以實現(xiàn)古籍?dāng)?shù)字化面向?qū)I(yè)領(lǐng)域的垂直發(fā)展。為系統(tǒng)推進專題性中華古籍?dāng)?shù)字化項目建設(shè),項目承擔(dān)方應(yīng)積極尋求與聯(lián)合國教科文組織合作,共同收錄和展示散佚在全球各地的相關(guān)珍貴文化典籍、手稿等資源,促進世界范圍內(nèi)文化遺產(chǎn)的保護、研究與共享。項目團隊?wèi)?yīng)積極參與國際標(biāo)準(zhǔn)化組織中與元數(shù)據(jù)、圖像格式等相關(guān)的技術(shù)委員會工作,將特殊字符處理、版本著錄規(guī)范等體現(xiàn)中華古籍特點的技術(shù)要求轉(zhuǎn)化為國際標(biāo)準(zhǔn),以保障跨國資源共享活動順暢運行。
2.從相對封閉的古籍語料庫構(gòu)建轉(zhuǎn)向更加開放的數(shù)據(jù)流通
古籍語料庫建設(shè)區(qū)別于古籍全文庫的數(shù)字化轉(zhuǎn)錄,需要對古籍進行句讀、分詞、詞性標(biāo)注等數(shù)據(jù)化加工,將其從數(shù)字文本形態(tài)轉(zhuǎn)變?yōu)榭缮疃壤玫臄?shù)字資源。目前中華古籍語料庫成果數(shù)量不足,語料資源分散,合作模式相對封閉,建設(shè)過程多以單個機構(gòu)或項目為單位,缺少跨機構(gòu)、跨領(lǐng)域的協(xié)同共建機制,導(dǎo)致重復(fù)勞動和數(shù)據(jù)孤島現(xiàn)象突出。中華古籍語料庫建設(shè)需要整個社會和行業(yè)的持續(xù)關(guān)注和投入,采用更加開放的數(shù)據(jù)流通模式。
一是推動構(gòu)建中華古籍語料國際聯(lián)盟,形成可協(xié)同演化的數(shù)據(jù)標(biāo)注機制。具體來講,通過國際學(xué)術(shù)交流項目、聯(lián)合研究課題等方式,培育和建設(shè)古籍語料標(biāo)注專業(yè)人才隊伍。投入大量人力是通用語料標(biāo)注的基本要求。中華古籍文本中存在常見異體字、特殊排版等現(xiàn)象,使得古籍語料標(biāo)注工作復(fù)雜性遠高于通用文本,不僅涵蓋文本結(jié)構(gòu)標(biāo)注、實體識別與關(guān)系抽取等,還涉及古籍編排規(guī)范、異體字處理、訓(xùn)詁注釋等高專業(yè)性的知識標(biāo)注活動,需要國際范圍內(nèi)具備人類歷史、文化、科學(xué)等相關(guān)知識背景的專業(yè)人員開展跨學(xué)科協(xié)作。為保障數(shù)據(jù)標(biāo)注工作的規(guī)范開展,聯(lián)盟組織應(yīng)在實體定義、語義標(biāo)注等方面制定中華古籍語料標(biāo)注的統(tǒng)一標(biāo)準(zhǔn),明確標(biāo)注范圍、層級與方法,統(tǒng)一數(shù)據(jù)結(jié)構(gòu)與字段格式等。同時,引入專家同行評審機制,組建由語言學(xué)、文獻學(xué)等多學(xué)科專家組成的專業(yè)委員會,對重點語料進行逐級審核與分級認(rèn)證,以提高語料庫試點成果的推廣價值與跨機構(gòu)通用性[13]。
二是制定古籍語料數(shù)據(jù)共享與激勵制度。中華古籍語料國際聯(lián)盟應(yīng)建立兼顧公共利益與權(quán)利保護的數(shù)據(jù)共享與版權(quán)管理機制,包括健全數(shù)據(jù)安全管理制度,版權(quán)確權(quán)、授權(quán)管理、敏感信息識別與處理等,確保語料在收集、處理和使用過程中的安全性。同時,探索建立語料流通的激勵機制,通過設(shè)立多邊合作的語料共享基金,設(shè)計公平透明的語料貢獻價值評估體系及潛在收益分享機制,提升古籍出版社、圖書館和高校等語料貢獻機構(gòu)在學(xué)術(shù)共同體和市場中的聲譽與影響力,保障數(shù)據(jù)要素收益在國家、權(quán)利主體和社會公眾之間合理流動,共享語料資源與開放利用成果。
3.從基礎(chǔ)的數(shù)據(jù)庫服務(wù)升級為體系化的綜合性古籍知識服務(wù)
目前,全球諸多圖書館、科研所等機構(gòu)基于典藏資源建立的中華古籍?dāng)?shù)據(jù)庫平臺,大多停留在題錄檢索和內(nèi)容影像閱讀等基礎(chǔ)服務(wù)層面,對不同用戶群體的差異化需求缺少考量,未能實現(xiàn)多層面、多角度的綜合性古籍知識服務(wù)。因此,應(yīng)根據(jù)不同類型用戶需求,從基礎(chǔ)的數(shù)據(jù)庫服務(wù)模式升級為體系化的綜合性古籍知識服務(wù)模式。
一是面向典藏單位人員用戶提供定制化的古籍?dāng)?shù)字化知識整合等技術(shù)服務(wù)。國際范圍內(nèi)有關(guān)技術(shù)公司、科研院所等機構(gòu)等應(yīng)積極參與中華古籍?dāng)?shù)據(jù)庫平臺建設(shè),組建專門團隊,針對該類用戶在信息采集、編目、加工等古籍?dāng)?shù)字化知識整合工作中產(chǎn)生的個性化服務(wù)需求,研發(fā)定制化、高效協(xié)同的技術(shù)和工具,提供古籍圖像資源精準(zhǔn)識別與內(nèi)容自動分類等智能輔助服務(wù),以及在線協(xié)同編校等功能,以切實滿足用戶的文化保存需求。
二是面向?qū)W術(shù)研究人員用戶提供專業(yè)化的古籍?dāng)?shù)字化知識建構(gòu)等科研服務(wù)。在開放科學(xué)背景下,世界各地相關(guān)政府機構(gòu)、基金組織、高校與技術(shù)公司等多元主體應(yīng)聯(lián)合構(gòu)建大型中華古籍?dāng)?shù)字化學(xué)術(shù)服務(wù)數(shù)據(jù)庫平臺,不僅要滿足用戶對古籍文獻集成的基礎(chǔ)服務(wù)需求,還要深入挖掘其在自動注釋與知識挖掘等方面的科研需求,提供更加專業(yè)、精細(xì)的服務(wù),如基于文本可視化技術(shù)協(xié)助用戶開展特定專業(yè)領(lǐng)域的古籍?dāng)?shù)字化知識建構(gòu),或基于語料庫技術(shù)輔助用戶進行電子化專題古籍研究和古籍整理等。
三是面向一般民眾用戶提供多元化的古籍?dāng)?shù)字化知識利用等閱讀服務(wù)。海內(nèi)外從事中華古籍?dāng)?shù)字化相關(guān)工作的出版社、圖書館等機構(gòu),應(yīng)結(jié)合全球中華古籍愛好者、受傳統(tǒng)文化教育者等一般民眾的閱讀習(xí)慣和知識利用需求,開發(fā)古籍大眾閱讀服務(wù)數(shù)據(jù)庫產(chǎn)品,同時注重利用AR、VR等技術(shù)打造多樣化內(nèi)容形態(tài),借助大數(shù)據(jù)等技術(shù)提供古籍知識推薦、協(xié)同注解、在線社區(qū)交流、閱讀批注共享等豐富的增值服務(wù)。如借鑒中華書局籍合網(wǎng)的任務(wù)眾包模式[14],在全球范圍內(nèi)組織廣泛的普通用戶群體參與在線古籍整理與傳播工作,提升古籍知識利用效率。
四、結(jié)語
大量中華古籍或以古代外交使節(jié)收購等自然文化交流形式傳到海外,或以國際文物販子走私等非正常渠道流失,或在戰(zhàn)爭中被劫掠奪,至今仍散落在海外學(xué)術(shù)機構(gòu)、圖書館、博物館等處,國際范圍內(nèi)多元主體亟須聯(lián)合開展古籍?dāng)?shù)字化工作,使其成為構(gòu)建人類命運共同體的文化基礎(chǔ)設(shè)施。如今,中華古籍?dāng)?shù)字化國際合作主體已在制度環(huán)境、技術(shù)條件和用戶需求等因素驅(qū)動下形成了多層次互動結(jié)構(gòu),并初步形成了典藏機構(gòu)間“一對一”合作等發(fā)展模式。未來,中華古籍?dāng)?shù)字化國際合作應(yīng)向更為高效的多元主體協(xié)作模式、更加開放的數(shù)據(jù)流通模式和更體系化的綜合性古籍知識服務(wù)模式轉(zhuǎn)變,以深入推進全球中華古籍資源整合、技術(shù)協(xié)同與服務(wù)創(chuàng)新。
|參考文獻|
[1]王宇,潘德利著. 中國古籍文獻流散與回歸[M]. 北京:中國社會科學(xué)出版社,2012.
[2]李一氓. 再論古籍和古籍整理 [J]. 編創(chuàng)之友,1983 (4):59-63.
[3]毛建軍. 古籍?dāng)?shù)字化的概念與內(nèi)涵 [J]. 圖書館理論與實踐,2007(4):82-84.
[4]周明璇,郭瑞宏. 全球視野下圖書館文獻傳遞與資源共享的版權(quán)風(fēng)險與發(fā)展策略 [J]. 圖書與情報,2024(4):111-117.
[5]2015年《關(guān)于保存和獲取包括數(shù)字遺產(chǎn)在內(nèi)的文獻遺產(chǎn)的建議書》的實施:建議書實施情況綜合報告[EB/OL].[2025-05-02]. https://unesdoc.
unesco.org/search/8d08b9d7-a5d9-4200-bd26-b42eb6908d24.
[6]李明杰,張纖柯,陳夢石. 古籍?dāng)?shù)字化研究進展述評(2009-2019) [J]. 圖書情報工作,2020 (6):130-137.
[7]Horizon Europe Work Programme 2023-2025[EB/OL].[2025-06-09]. https://research-and-innovation.ec.europa.eu/funding/funding-opportunities/funding-programmes-and-open-calls/horizon-europe/cluster-2-culture-creativity-and-inclusive-society_en.
[8]李明杰,鄭翔,關(guān)思雨. 數(shù)字人文在古籍整理領(lǐng)域的應(yīng)用路徑及發(fā)展策略 [J]. 中國圖書館學(xué)報,2024 (4):21-38.
[9]中華古籍善本聯(lián)合書目. [EB/OL].[2025-10-16]. http://read.nlc.cn/allSearch/searchList?searchType=62amp;showType=3amp;pageNo=6amp;searchWord=.
[10]吳玉靈,閆東芳. 國內(nèi)外中文館藏古籍?dāng)?shù)字化保護現(xiàn)狀分析與對策研究 [J]. 圖書館研究,2023(3):52-59.
[11]古籍出版數(shù)字化調(diào)研報告課題組,林曉芳. 古籍出版數(shù)字化發(fā)展中的三對矛盾、突出問題與建議 [J]. 出版參考,2024(5):17-22.
[12]全國古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組關(guān)于印發(fā)《2021—2035年國家古籍工作規(guī)劃》的通知[EB/OL].(2022-10-11)[2025-10-16]. https://www.nppa.gov.cn/xxfb/tzgs/202210/t20221011_666349.html.
[13]徐擁軍,陳曉婷,閆靜. 建設(shè)文化遺產(chǎn)中文語料庫的挑戰(zhàn)與對策 [J]. 創(chuàng)意設(shè)計源,2025 (4):1-8.
[14]楊石華,吳雨婷. 出版知識服務(wù)賦能中華優(yōu)秀傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展 [J]. 出版廣角,2024(12):11-17.