摘 要:古籍數字化整理出版是推進古籍知識深度開發與利用的基礎,是傳播中華文明文化內涵與歷史精神的重要途徑。當前古籍數字化整理與出版主要強調古籍媒介形態的轉變與組織形式的結構化,不僅忽略了內容知識層面對古籍知識及其關聯性的語義挖掘,而且在大眾化傳播方式與出版服務場景等方面缺少創新手段。本研究通過梳理古籍整理出版的發展歷程,結合數字化環境下古籍整理與出版的模式特征,歸納與總結智能環境下古籍整理與出版的創新路徑,以期為我國古籍數字化建設的持續發展提供可行的思路與借鑒參考。
關鍵詞:古籍數字化 古籍整理 古籍出版 模式分析 路徑識別
古代典籍記錄了中華文明發展存續與社會變遷的歷史過程,承載了民族文化記憶與精神譜系,是文明現代化傳承不可或缺的媒介。[1]古籍整理與出版是實現古籍文化知識生產、組織與傳播的核心工作,對于中華文脈傳承與保護有著重要意義。然而,針對海量古籍進行有效整理與出版是一個極具挑戰性的龐大工程。
數字技術的不斷引入為解決上述問題提供了改進方向。通過將古籍材料進行數字模態與數據模態的轉化,能夠在數字環境下提高古籍的加工與整理效率,拓展多元化的出版方式與傳播渠道,進而提升古籍的開發與利用效率。智能時代,古籍整理出版模式發生了巨大轉變。以人工智能與虛擬展陳為代表的智能技術大幅度提升了古籍整理的效能,拓展了現有出版與傳播的多元場景。古籍的知識維度與內容深度得到了顯性化展現,不同用戶群體的閱讀體驗與認知理解得到全方位增強。因此,探索古籍數字化整理出版的創新路徑成為一項重要議題。
一、古籍整理出版的歷史脈絡與遺留問題
(一)古籍整理出版的發展歷程
古籍整理出版自古有之。簡牘被認為是我國古代記錄文字的主要媒介,其出現最早時間可追溯至商代。《尚書·多士》有云:“惟殷先人,有典有冊”,殷墟出土的甲骨文典冊即“龜冊”便是簡牘的早期形式之一。簡牘流傳之盛,傳至漢代,書籍收藏與傳播成為當時文化制度建設的重要一環。[2]前有劉向、劉歆父子整合與校理藏書典籍,所完成的《別錄》《七略》為古典文獻學早期之集大成者,如班固所言:“七略剖判藝文,總百家之緒,……劉向司籍,九流以別”[3],后有東漢蔡倫發明紙張,更是標志著古籍生產與整理進入大量生產階段,繼而推動書籍交換與流通的萌芽。《后漢書·文苑傳下·劉梁》寫道:“(劉)梁,宗室子孫,而少孤貧,賣書于市以自資。”可見一斑。
隨著印刷技術的革新,古籍整理與出版事業在唐宋時期迎來盛世。雕版印刷術與活字印刷術等技術的發明,顯著提高了官學與民間著書生產的效率,加快了造紙技術與文化知識傳播的速度,特別是出現了繁盛的對外貿易。在社會層面,“盛世修典”成為歷代王朝重視的國家工程,一些官修類書如《藝文類聚》《太平御覽》更是由皇帝親自敕令編修。據《新唐書·孔穎達傳》引,(唐)太宗下詔曰:“卿等博綜古今,義理該洽,考前儒之異說,符圣人之幽旨,實為不朽。”在民間,考據義理頗為興盛,朱熹在《孟子精義·自序》中云:“漢魏諸儒正音讀,通訓詁,考制度,辯名物,其功博矣”[4],可見朱子對“先考據再訓詁而后義理”之推崇,為系統化古籍整理提供了基礎方法論。到明清兩代,品類各異的民間叢書出版流通,成為推動出版印刷行業不斷發展的動力,至此中國出版行業出現“大眾傳媒化”的萌芽。[5]大量罕見的珍本與散佚篇目得到整理,尤其是刻書發行數量激增。據楊繩信關于中國書籍刊刻的調查,明代的刊刻書籍總量相比于宋、元兩代足足超出4倍之多。[6]受到章學誠“辨章學術,考鏡源流”學說的影響,清代藏書學者普遍精于文獻考據、校勘和輯佚,因而刻書質量更加精良。
在現代出版技術的沖擊與中西文化相互交融的雙重作用下,民國以來,中國出版行業進入快速發展時期。依賴人力的雕版印刷出版逐漸被大規模機械化工業所取代,五四新文化運動帶來對于新、舊文化形式下民族出版模式的認同與思考,以及在這一歷史社會轉型中古籍整理出版出現的諸多形式轉變——它們共同為出版行業的現代化進程奠定了基礎。據《民國時期總書目》統計,民國時期由新式出版機構出版的各類圖書共計約12萬種之多。[7]相比早期的印刷技術,這些出版物的編排更加規范,紙張工藝更加美觀。例如近代目錄學家羅振玉先生于1916年在日本影印出版的一批中國古籍珍善本采用了京都小林氏的先進珂羅版技術,既保留了底本的原貌,又統一了開本尺寸。[8]
(二)數字環境下古籍整理出版的問題
自20世紀70年代末至今,我國古籍出版進入數字化階段,并歷經了從再生性保護到信息查詢與利用,再到傳承性保護三個演進階段。[9]最初,古籍數字整理出版僅通過掃描設備對古籍善本進行原物掃描與原樣復制。雖然實現了永久無損古籍[10],但整理出版作品的分辨率低且難以進行內容檢索,無法滿足專業學者的研究需要。因此,古籍數字出版轉向了面向信息查詢與利用的古籍數據庫建設階段,即將古籍數字內容進一步數據化后存儲至結構化數據庫中,從而為用戶提供高效的文獻檢索和閱讀服務。
當前古籍數據庫的核心受眾大多為專業研究人員而非大眾,因此如何“使古籍從艱深晦澀走向通俗易懂,使古籍出版從專業領域擴展至大眾領域”成為古籍數字化出版的一大難題[11],其中,古籍多維度的知識生產與組織是最值得重視的問題。信息技術與數字人文方法的不斷引入,為古籍內容的深度加工與有序整理提供了必要的技術支持。但受限于已有古籍基礎設施的不完備,古籍數字化整理仍以元數據編目與標引為主,對文本內容的知識探索與語義挖掘較為缺乏。這一現狀導致數字化過程成為流于資源形式的表面轉換,未能實現知識的深度拓展與智力增值,最終制約了古籍文獻價值的全面挖掘,也暴露出當前古籍數字化整理“細粒度性不足”與“關聯程度低”的問題。[12]
在服務層面,古籍出版商不再只是簡單的數字內容搬運工,而理應成為知識服務與文化傳播的供應商。已有研究表明,多數古籍數字化產品仍停留在基礎資源展示階段,其功能服務(如檢索、瀏覽等)較為單一,對大眾用戶的吸引力較弱。[13]特別是對“Z世代”而言,低質量、低趣味的古籍閱讀與脫離代際認同的出版場景可能會顯著降低其文化傳承的使命感,進而導致文化斷代的風險。[14]因此,推進古籍數字化出版的產品優化與服務創新迫在眉睫。
二、古籍數字整理的模式解析
(一)古籍整理對象精細化
在傳統古籍數字整理的觀念中,數據庫是古籍整理的最終產物。我國古籍數據庫建設早在20世紀80年代至90年代初期便開始進行了初步探索。[15]上海圖書館在1986年對外開放了自建的“中國古籍善本查閱系統”,引領了后期各類古籍電子目錄索引工程的推進;北京大學作為高校中古籍數字化的領軍機構,率先建立了古籍資源的電子數據庫,如其中文系教授李鐸開發的“全唐詩電子檢索系統”以120冊康熙欽定《全唐詩》32卷光緒十三年上海同文書局版本、中華書局25冊點校本等為參考先后錄入了近5萬首精校的唐代詩歌,是早期的專題數據庫代表作品。[16]其中,古籍數據庫的建設重點集中在原始圖像的高清數字化、目錄結構的有序整理以及元數據的規范著錄方面。例如《國家圖書館電子圖書元數據規范和著錄規則》便以“都柏林核心元數據元素集”為基礎,規定了包括題名、創建者、主題等在內的19種核心元素[17],為古籍書目控制提供了參考依據。2000年后中國數字人文的“火熱”帶來人文學術的全新機遇,古籍數字化整理向全文化與知識化轉變,尤以一批全文庫與知識庫最為引人矚目。由哈佛大學教授包弼德(Peter K. Bol)主持的中國歷代人物傳記數據庫項目(CBDB)是其中最具影響力的代表。[18]它系統收錄了自7世紀至19世紀共53萬人的資料,并以中國歷史“人物”為核心,依據海量中文古籍語料對人物的出生、死亡、婚姻、家庭、社會出身、教育及宦歷等重要信息進行全方位登記,為實現包括群體傳記學、社會網絡分析與地理信息系統等多種量化分析提供了數據基礎。
(二)加工技術的智能化演變
不斷精進的數字技術、信息技術乃至智能技術在計算處理能力與文獻挖掘方面的優勢越發明顯,特別是人工智能的蓬勃發展將智能化整理推上了時代舞臺的最前沿。早期基于啟發規則的方法在古籍實體自動抽取方面得到了廣泛應用。隨著古籍加工的知識對象不斷拓展,數字化整理任務也變得更加復雜,古籍自動標點、古籍命名實體識別、古籍實體關系抽取與古籍事件檢測等內容知識抽取任務相繼得到學界與業界的重視。北京師范大學中文信息處理研究所設計的基于BERT的古漢語斷句模型,由33億字大規模古籍語料進行訓練而成,詩、詞與古文三種文體的預測效果超過了90%。[19]在實體識別任務上,北京大學數字人文研究中心以“深度主動學習”策略研發的“吾與點古籍智能處理系統”將冷啟動環境下古籍實體抽取的性能進一步提升到88%以上的識別水平。[20]此外,以生成式人工智能為內核動力的古籍智能體模型逐漸嶄露頭角,并已具備初步的“思考與推理”能力,諸如荀子大語言模型、AI太炎等在關系抽取、文白翻譯等多個任務上表現出色,有力證明了智能古籍模型開發路徑的可行性與巨大潛力。
(三)古籍知識聚合與價值挖掘
近年來,古籍內容知識語義關聯的重要性已經得到人文社科界的廣泛共識。聚合古籍多路徑與脈絡的知識將有利于實現對古籍的全局理解與多視角分析,最大程度發揮數字人文的方法價值,為人文知識發現與研究創新提供潛在可能。臺灣大學項潔教授提出了“多重知識脈絡和關聯結構”的理念[21],其構建目標在于利用數字系統的特性,讓檔案同時具備原生的、編排的以及詮釋的脈絡,并使不同脈絡間的關系得以被觀察。構建古籍脈絡的核心在于建立不同級別、層次與粒度的知識“聯系”,強調跨機構、跨網域、跨領域、跨時空的關聯融通,從而實現“社會記憶”多重證據參照體系的整體性、連續性和系統性。[22]古籍知識關聯性的頂層設計就是需要建立古籍通用的層次知識結構[23],其中本體建模與關聯數據是進行語義聚合的關鍵方法。從古籍知識關聯實踐層面來看,上海圖書館開發的“中文古籍聯合目錄及循證平臺”[24]為我們提供了良好的應用例證。該平臺將1400家海內外不同來源的異構古籍目錄數據加以整合,能夠支持歷史的、文化的及社會的多重證據參照與循證實踐。令人倍受鼓舞的是,這些聚合好的知識資源完全開放與免費,不但能夠支持相關學者進行目錄版本與源流分析,而且還通過上海圖書館年度開放數據競賽的形式走入了社會大眾,對古籍數字化建設的大眾創新起到了激勵作用。
三、古籍數字出版的模式分析
(一)古籍出版媒介的迭代更新
在數字化發展初期,古籍數字出版重在對古籍善本的原生性保護,通過影印、OCR(光學字符識別)等數字技術將物理載體的古籍轉移至數字空間,并以電子書的形式進行出版。在此基礎上,為滿足研究人員的閱讀需要,數字出版策略由簡單的內容復制轉向文本結構化、數據庫化,主要利用網頁服務來支持用戶進行圖文閱讀與文字檢索。為進一步拓展古籍的受眾,實現從專業學者向普通大眾的傳播轉向,當前古籍出版工作結合新興技術,積極拓展出版渠道、創新出版形式,逐步由單一電子出版物向多元化新媒體知識平臺發展,如短視頻、公眾號、在線直播、有聲書、XR古籍產品等。這些出版媒介更加貼合當代人的閱讀習慣,突破了傳統靜態閱讀的限制,以生動有趣且直觀的方式傳播中華優秀傳統文化知識,拉近了大眾與古籍的距離。例如,古聯公司開發的“句讀”小程序通過游戲化設計理念,構建聯機對戰與積分激勵機制,吸引了大量非專業年輕用戶參與古籍標點實踐,激發了年輕群體的古籍學習熱情。[25]
(二)出版參與主體的多元化協作
從出版主體屬性來看,當前古籍數字化出版仍呈現機構主導特征,即以單一機構為主體開展獨立出版活動,跨機構的交流合作較少,資源重復建設現象屢見不鮮。例如,有學者通過開卷數據平臺查詢到僅《紅樓夢》的出版版本就有4857個,這不僅增加了用戶的信息檢索成本,還造成了出版資源的嚴重浪費。[26]隨著古籍數字化進程的深入推進,越來越多的主體加入古籍出版市場并意識到集體協作的重要性,開始構建跨機構、跨領域的全球合作網絡,通過整合專業研究機構、學術團體及民間愛好者等多方資源,共同打造高質量的古籍數字出版產品。典型案例如北京大學與字節跳動公司聯合成立的古籍智能實驗室,其開發的“識典古籍閱讀與整理平臺”在國內引起了廣泛關注。該平臺期望通過構建開放式數字生態系統,集成化發布與出版優質的古籍全文數據,有效解決古籍數字化利用過程中的瓶頸問題。此外,古籍數字資源平臺也越發重視平臺與用戶的關系建構,特別表現在平臺交流功能的開發上。[27]以籍合網的附屬社區“古籍圈”為例,它為廣大古籍愛好者及專業學者提供了一個學術交流與興趣分享的平臺,用戶可以圍繞古籍典故、文化知識與歷史問題在平臺上展開提問、作答與討論。在多主體的協同參與下,更多類型的用戶將加入古籍知識的數字化開發與利用中,推動形成開放共享、多元協作的知識生產生態,為古籍內容的價值共創提供可持續的發展路徑。[28]
(三)出版服務從學術研究轉向大眾傳播
古籍出版因其學科專業性強、文本闡釋難度高等特征,產生了較高的受眾認知門檻,一定程度上制約了其在公共文化領域的傳播效能。長久以來,古籍數字出版僅停留在文本材料的數字轉化上,難以實現知識的普及傳播與社會化應用。[29]當前,古籍數字出版正處于從學術研究向大眾知識服務的轉型期。注重古籍出版物的表現形式,強調更加個性化、精確化的服務,以貼合不同用戶群體的閱讀需求,成為實現傳播中華優秀傳統文化,保障公共文化服務的重要手段。[30]一方面,借助短視頻、社交媒體等傳播速度快、影響范圍廣以及觀眾互動強的優勢,古籍數字出版能夠將蘊含在文獻典籍中的哲學智慧與歷史經驗,以通俗易懂的方式融入大眾日常生活與工作中,潛移默化地改變讀者的閱讀體驗與交流方式;另一方面,結合虛擬現實(VR)、增強現實(AR)等新興技術,古籍數字出版可以生成支持古籍閱讀多維感官體驗與沉浸式閱讀的虛擬場景,有效提高了大眾古籍閱讀的興趣,增強對古籍文化知識的傳播力、影響力。黃山書社發布的“AR四大名著”項目以可視化、互動化與游戲化來重組與展示古籍文本的內容知識,不僅提高了古籍的可讀性,還激發了用戶對于中華傳統文化的閱讀興趣。另外,為順應出版行業融合發展的態勢,古籍數字出版通過與影視、游戲及其他周邊文化產業合作來開發特別主題的古籍產品,進一步擴展了古籍的數字傳播場景,如國家圖書館授權開拍的《山海經》短劇受到當前年輕人的熱捧,形成了傳統文化再生產的新范式。[31]
四、智能賦能下的古籍整理出版新途徑
智能時代到來,想要進一步提升整理效率與出版品質并提煉與升級古籍的核心價值,就必須牢牢抓住時代風口的機遇:在基礎設施、技術升級與服務更新等諸多方面不斷推陳出新,以智慧技術為原動力不斷發掘與踐行古籍整理生產與出版傳播的新方式與新策略,從而加快古籍成果的創造性轉化,保障古籍行業深度高質量發展。可呈現為以下幾點。
第一,打造系統化、協同化與智能化的古籍基礎設施群,拓展古籍知識整理與開發的多元路徑。人文基礎設施的概念被認為是一種支持數字人文研究活動的“研究基礎設施”,包括數字化的文獻資源、數據庫、工具平臺、支持知識生產和信息交流的網絡空間等,需由數字出版商、研究機構、研究者、IT支持人員共同參與構建。[32]數字時代,建設人文基礎設施已成為支持人文研究與促進研究創新的核心基礎。針對古籍這一特殊領域,由于其涉及多學科交叉、多樣化的研究任務及復雜的應用場景,所以亟須構建面向整理出版目標且兼具系統性與協同性的智能化基礎設施群。其建設核心在于要以高質量迭代訓練的古籍大語言模型作為技術基座,開發、優化與融合先進智能算法、系統與平臺,從古籍多模態特征、層次化元數據及豐富的語義內容層面,支持不同的古籍整理與知識加工任務,包括元數據標引、版面分析、異體字檢測、OCR識別、自動句讀與標點、自動分詞與詞性標注等;同時拓展模型服務的邊界,注重古籍知識分析與計算的服務能力提升,如海量古籍的自動摘要、大規模作者歸屬識別、文體風格的遷移分析、古籍知識的復用關系勘測、古籍概念知識的演變分析、版本溯源與數字考據分析等。上述基礎設施之間不能是完全孤立的,而應該以統籌協作的方式進行功能性耦合與任務搭配,共同組建成一個有機的智能整體,以服務科研與應用實踐。例如打通從古籍“自動分詞”到關鍵性詞匯的“詞頻分析”再深入到“古籍概念知識演化建模”的功能性路徑,能夠幫助使用者更清楚地理解中國歷史文脈傳承的演變規律。在具體開發路徑實踐中,古籍文本智慧整理還面臨對特定任務進行知識標注的數據量較少、多人標注與整理結果不一致或者噪聲引入、模型計算與訓練所需的資源與硬件成本較高而難以訓練等問題。因此需要進一步通過融合人機回路(Human-in-the-loop)、人智融合(Human-AI Collaboration)以及知識蒸餾(Knowledge Distill)等策略,在降低模型訓練規模的同時增強模型的少樣本理解與推理能力,并通過對智能模型的知識內化與價值對齊,使得基礎設施智能化進程得到積極引導與顯著增強,為更加完備與可持續的古籍智能化整理開辟新的路徑。
第二,打破古籍出版機構之間的知識壁壘,構建面向古籍整理出版全生命周期的生態。首先要將獲得的各類古籍資源、元數據與古籍知識元進行“縱向”知識整合與“橫向”關聯拓展,完成對古籍知識組織體系的重構。其中,“關系”是整個知識體系最重要的“組織單元”,既包括古籍文獻與書目元數據之間的各種附屬關系,又包括詞匯之間的共現關系、實體之間的社會關系、事件與實體之間的邏輯關系、概念主題之間的語義關系等。透過不同的關系組合,能夠匯聚與生成更多的非線性創新知識模式,包括但不限于異構資源之間的合并與篩選、跨模態數據的匹配與融通、知識邏輯的相互參照與引證、語義鏈接與知識實體的拓展、多知識關系的復用與繼承等。針對出版機構間因產權保護而產生的技術聯通與資源共享障礙,一個可行的解決思路是制定有關古籍資源、數據與平臺交互的規范協議,并在技術層面利用智能協作技術來實現資源與知識層面的安全嵌入與對接。關聯數據與語義網技術的推廣能夠將獨立機構整理與發布的古籍資源對象有效聚合起來,而機構自身無須重新設計新的古籍知識體系表述邏輯;聯邦學習與區塊鏈技術的應用[33]可以保障網絡硬件層面上的去中心化,通過智能合約保障專業化的群體學習與數據對接,從而實現多區域、多平臺之間的可靠性全耦合學習機制,提升古籍資源安全共享的效率。融合上述各類古籍知識體系及多平臺之間的連接與合作,可以最終打造出一個可信任、可持續與可拓展的古籍整理出版生態。“可信任”要求所有生態要素之間的關聯具備邏輯可解釋性與循證可靠性,這是智能化古籍整理與出版的前提。“可持續”從生態的動態特征切入,對關聯的生態要素在技術、資源和知識層面都有持續發展的要求,如需要建立高可用的多級古籍出版網絡。從創新的角度來看,古籍整理與出版生態的“可拓展”需要不斷引入更先進的智能技術,如多模態古籍大模型的研發、古籍通用知識模型的優化等,并圍繞古籍基礎設施、古籍資源對象以及古籍出版媒介進行技術融合與產業升級,從而推動生態鏈長期、有序且健康發展。
第三,推進多元化古籍出版產品的開發與利用,構建價值創新的服務場景與服務體系。古籍出版媒介已經經歷從物理紙版到數字模態的巨大轉變,所承載的古籍內容發布載體也越發趨向于富媒體化,呈現出多樣化的“虛擬態”特征,如電子圖書、音頻解說及視頻電影等。這些數字載體將古籍內容中富含的知識內涵與文化精神在網絡空間不斷放大與傳播,形成了前所未有的影響規模。在智慧化數字出版倡議下,古籍出版媒介還需要得到進一步拓展與改善,充分體現出其“人本主義”“大眾化”與“個性化”的時代特性。首先,古籍服務的對象不僅僅是專業的用戶,更應該擴展到廣泛的社會大眾。一直以來,古籍生產者與出版商是古籍出版媒介的主體,在知識出版與傳播方面擁有絕對的話語權。智慧古籍出版則應該改變這種不平等的單方向知識攝入方式,堅持以大眾參與與尊重用戶需求為導向,結合不同用戶群體的代際特點與個性化訴求,設計和開發與之相適應的媒介,如“Z世代”對亞文化與游戲的熱愛可能會引領他們聚焦于以“中國歷史與文學”為藍本的網絡游戲。其次,古籍出版內容價值需要通過產品的多維度數字呈現來體現,其用戶服務效果與技術上的迭代與開發緊密相關。將VR、數字孿生和全息成像等虛擬展陳技術與智能技術不斷融合,能夠實現古籍知識在人類視覺場域的活化,增強用戶的具身性體驗。這種超越文本話語的沉浸式交互,使用戶能夠身臨其境地重返數百年、數千年前的古代文明,進而形成對中華歷史文化的深度感知與意義認同。例如,可以將云端展陳與線下觀展相結合,讓觀眾通過與“虛擬朱熹”[34]對話來感受理學的博大精深與文化魅力。
五、結語
古籍出版業的發展是中華文明發展進程的加速器。從簡牘著書到印刷刻字,從紙版到網絡媒介,無不彰顯出中國古籍整理出版的多重嬗變。數字化技術不僅給古籍帶來了材料形態的轉化,更為古籍內容的激活、古籍知識的價值再造和古籍產品的創新開發創造了前提條件。盡管當前古籍數字化已取得階段性成果,但在古籍知識整理的深度、古籍加工方式的自動化和古籍出版策略的多樣性方面仍有待加強。本研究通過對古籍數字整理與出版的相關典型案例進行分析,從整理過程與出版方式兩個角度歸納其模式,即古籍整理的“對象精細化”“加工智能化”“知識關聯化”以及古籍出版的“媒介更新化”“主體多元化”和“場景大眾化”六大核心特征。為進一步提升古籍數字化整理出版的能力、質量與水平,本研究在智能技術框架下提出了可行的發展路徑,分別針對基礎設施群的建設、整理出版的生態構成及創新出版產品與服務場景的開發三個方面進行了闡釋。筆者希望上述研究成果不僅能夠為古籍整理出版的理論提供延展,也為古籍出版行業的智能化發展帶來新的啟發與切實可行的改進思路。
參考文獻:
[1]康亞飛.知識的傳承、聯結和再生產:我國古籍數字出版的新形態[J].編輯之友,2024(11):45-51.
[2]王克奇.論漢代的文獻收藏和整理制度[J].史學月刊,1984(6):20-26.
[3]王重民.論《七略》在我國目錄學史上的成就和影響[J].歷史研究,1963(4):177-190.
[4]張宏鋒,王建軍.朱熹《孟子》考據學平議[J].保定學院學報,2021,34(2):32-38.
[5]大木康.明末江南的出版文化[M].周保雄,譯.上海:上海古籍出版社,2014:67.
[6]楊繩信.中國版刻綜錄[M].西安:陜西人民出版社,1987:58.
[7]吳永貴.民國出版史[M].福州:福建人民出版社,2011:77-83.
[8]薛冰.書事:近現代版本雜談[M].天津:天津人民出版社,2020.
[9]張寧.我國古籍數字出版的目標演進、轉向與進路[J].出版科學,2023,31(4):5-16.
[10]王秋云.我國古籍數字化的研究現狀及發展趨勢分析[J].圖書館學研究,2021(24):9-14.
[11][26]陳文韜,馬美著.出古入新:文化傳承發展背景下大眾古籍出版路徑探析[J].出版廣角,2024(6):4-8.
[12]雷玨瑩,王曉光.智慧數據視角下古籍數字出版的創新路徑研究[J].出版發行研究,2023(8):21-28.
[13]糜濤.古籍出版數字化的研究現狀與前景探析[J].山西檔案,2025(3):186-188.
[14]翁昌壽.世代轉換視角下的“年輕態”閱讀轉型與融合出版[J].出版發行研究,2023(8):12-20.
[15]趙薇.數字時代人文學研究的變革與超越:數字人文在中國[J].探索與爭鳴,2021(6):191-206,232-233.
[16]周婧.北京大學“全唐詩電子檢索系統”[J].電子出版,2003(8):5-7.
[17]詹麗華.我國中文電子圖書書目數據揭示研究[J].圖書館雜志,2021,40(10):64-71.
[18]Bol P,Hsiang J,Fong G. Prosopographical Databases,
Text-Mining,GIS and System Interoperability for Chinese History and Literature[C]//Proceedings of the 2012 Digital Humanities Conference,2012:43-51.
[19]胡韌奮,李紳,諸雨辰.基于深層語言模型的古漢語知識表示及自動斷句研究[J].中文信息學報,2021,35(4):8-15.
[20]嚴承希,唐雪梅,楊浩,等.HanNER:一個面向漢語古籍語料命名實體自動抽取的通用框架[J].情報學報,2023,42(2):203-216.
[21]項潔,洪一梅.數字人文取徑下的淡新檔案重整與分析(上)[J].檔案學通訊,2020(6):4-13.
[22]夏翠娟.構建數智時代社會記憶的多重證據參照體系:理論與實踐探索[J].中國圖書館學報,2022,48(5):86-102.
[23]陳濤,趙曉飛,楊鑫,等.古籍文獻通用知識模型研究與設計[J].信息資源管理學報,2025,15(1):139-153.
[24]夏翠娟,林海青,劉煒.面向循證實踐的中文古籍數據模型研究與設計[J].中國圖書館學報,2017,43(6):16-34.
[25]洪濤,陳必佳.古籍數字出版領域的知識服務模式和場景分析:以古聯公司為例[J].出版廣角,2022(24):51-56.
[27]陳羽,陳玥穎,張瑞秋.基于敘事設計視角的古籍數字平臺設計研究[J].包裝工程,2022,43(16):311-317.
[28]雷玨瑩,王曉光.可供性理論下古籍數字平臺的價值重構和提升策略[J].出版發行研究,2023(11):19-24.
[29]顧雷.古籍出版與古籍保護關系芻議[J].大學圖書館學報,2020,38(4):100-105.
[30]雷玨瑩,王曉光.數字人文視域下古籍出版的內容價值增值[J].科技與出版,2023(3):105-109.
[31]劉燕飛.古籍圖書大眾化出版的現狀及發展[J].出版發行研究,2023(8):78-85.
[32]夏翠娟.面向人文研究的“數據基礎設施”建設:試論圖書館學對數字人文的方法論貢獻[J].中國圖書館學報,2020,46(3):24-37.
[33]范志強,張志才.基于區塊鏈聲譽管理的安全公平的聯邦學習[J].測試技術學報,2025,39(3):291-297,304.
[34]史術光,賴芳,李松志.基于AR技術應用的白鹿洞書院文化旅游資源創新設計研究[J].綠色科技,2021,23(13):192-195.
(作者單位:嚴承希,中國人民大學信息資源管理學院、中國人民大學數字人文研究院;曾玉榮、李佳怡,中國人民大學信息資源管理學院)