999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

古籍資源的數字化利用與創新

2025-07-30 00:00:00穆荷怡
現代閱讀 2025年11期
關鍵詞:古籍整理石刻古籍

“籍合網\"著眼于全流程古籍數字化整理與應用,打通了人才培養、科技賦能、版權保護、內容編輯、知識加工、成果展示等各個關鍵節點,將各業務模塊組織成一個有機整體且能相互驅動、共同增益,打造出開放、創新的古籍整理業態,促進了跨學科、跨領域的交叉研究及相關應用成果的落地。

古籍數字化發展伊始

卷帙浩繁的古籍文獻是記錄中華文明最為重要的載體,在開展有效保護的同時,如何讓束之高閣的“文物”進入尋常書架,如何令艱難晦澀的“文字”更加易懂易讀,真正實現“在創造性轉化和創新性發展中麝續中華文脈”一直是古籍整理事業的題中之義(古籍整理概念與類型可參考許逸民《古籍整理釋例》,黃永年《古籍整理概論》,黃永年原著、周曉薇等旁征《lt;古籍整理概論gt;旁征》)。

進入21世紀,數字化浪潮迭起,出版行業開始尋求數字化轉型,中華書局作為古籍整理出版的“重鎮”,也正式啟動了古籍數字化的探索與實踐。2014年發布首款古籍數據庫產品《中華經典古籍庫》,第一期收錄書目294種,均為中華書局近百年來古籍整理的精品之作;2015年成立古聯(北京)數字傳媒科技有限公司,專門從事古籍數字化建設及傳統文化數字產品研發與推廣;2018年上線國家級古籍數字化整理與應用綜合服務平臺一“籍合網”。作為“十四五”重點出版物出版規劃項目之一,“籍合網”不斷拓展和推進,以“產學研”相結合模式,將專業化的精品內容和智能化的技術手段接軌,驅動資源、技術、人才三聚合,為古籍領域的融合出版與創新發展開辟了一條新道路,于2022年入選數字出版優質平臺遴選推薦計劃。

古籍數據庫產品建設

歷經多年,“籍合網”形成了以數據庫為核心,整合在線編校、技術研發、人才培養、校企合作的產業服務矩陣。其中,數據庫產品不僅是中華書局正式開啟古籍數字化業務的起點,也是現有產業服務矩陣中的重點。截至2025年,“籍合網”已發布古籍相關數據庫30余個,資源規模達40億字以上,在不斷積累的過程中,數據庫產品在打破信息壁壘、豐富出版路徑、提供知識賦能等諸多方面開展了有益嘗試。

籍合網

1.打破信息壁壘

在數據庫產品集群中,率先發布的《中華經典古籍庫》是當之無愧的“拳頭產品”。自2014年上線以來,逐步開發出鏡像版、網絡版、微信版和學習強國版,適配不同的使用場景;以每年一期的頻率穩定更新,現已延續至第十二期,上線整理本古籍超1萬種,共計27.5億字,榮獲“第四屆中國出版政府獎”。《中華經典古籍庫》已成為國內使用最廣泛的古籍數據庫之一。

在此之前,最早在20世紀末、21世紀初,市場上已出現全文維度的古籍數據庫產品(涵蓋目錄類、影像類、全文類等多種形態,具體可參考朱鎖玲、包平《我國古籍數字化進展與研究述評》,此處僅述及全文類數據庫),文淵閣《四庫全書》電子版、北京書同文數字化技術有限公司《四部叢刊》電子版、北京愛如生數字化技術研究中心《中國基本古籍庫》均頗具代表性,相關產品使古籍數據庫脫離了原始的書目查閱、圖像瀏覽階段,真正進入“全文時代”,開創了古籍數據庫的“新紀元”。

然而受制于版權合規性問題,上述數據庫基本是以原始文獻(或其影印本)作為資源收錄對象,故而不可避免地導致古籍點校整理成果缺失,加之早期囿于技術水平,文字疏漏較多,重復建設嚴重(古籍數字化選題重復情況可參考王立清《略論我國古籍數字化的選題》),對用戶使用造成不便,《中華經典古籍庫》在此背景下應運而生。立足于中華書局之所長,該數據庫收錄的圖書是匯集民國以來無數學者智慧結晶的古籍整理本,經過句讀標點、校勘注釋,乃至白話翻譯之后,在保留原始文獻經典內容的基礎上,更加易于現代人閱讀和理解。產品一經問世,就在學界內廣受好評,得到眾多專家的一致認可。

然而,古籍整理工作的時間和物質成本頗高,傳世文獻中經過整理者不足十一,且整理成果往往由不同的出版機構出版,版權歸屬自然也不同。據不完全統計,新中國成立以來,各出版機構總計出版古籍整理圖書達3.6萬種以上(數據可參考陳香《讓經典“活”起來,讓古籍走進大眾》、原彥平《新時代中華優秀傳統文化出版的新任務一以古籍整理出版為中心》),僅僅依靠中華書局出版的圖書,《中華經典古籍庫》難以實現大規模的資源整合和持續更新,與相關出版單位進行版權合作勢在必行。對此,《中華經典古籍庫》以專業古籍出版機構為切入點,在對相關書目進行初步遴選之后,主動聯系并以版稅分成的方式啟動洽談工作,參考可授權資源體量、年限、是否獨家、交付方式等因素溝通具體的分成比例。通過與專業古籍出版機構的合作實踐,《中華經典古籍庫》探索出相對成熟的合作模式,并在此后不斷擴大合作對象和地域范圍(目前,除專業古籍出版機構外,中央和地方綜合出版機構、高校出版機構等均有出版古籍相關圖書),同時通過持續的收益分成建立起穩定的合作關系,促進了圖書版權的長期續簽。

基于正式授權,《中華經典古籍庫》從第四期開始陸續收入其他出版機構的優質資源,包括鳳凰出版社、浙江古籍出版社、巴蜀書社、岳麓書社、大象出版社、中國人民大學出版社、華東師范大學出版社等20余家,在古籍領域內首次實現了跨地域、跨集團的版權合作,打破了信息壁壘,提高了古籍整理成果的利用效率,達到了資源整合的新高度。

2.豐富出版路徑

在深入開發出版機構版權資源的同時,數據庫產品也嘗試在成果來源上進行探索和創新,不再遵循“先出版紙書后進行數字化”的傳統軌跡,而是獨立策劃選題并聯系作者,將作者的專業整理成果直接進行結構化的數據加工,通過數據庫產品的形式進行公開發布,實現線上、線下雙通道出版。《中華石刻數據庫》即開創了專業整理成果直接轉化為數據庫產品的先例。

《中華石刻數據庫》

《中華石刻數據庫》旨在建設資源豐富、內容權威的石刻文獻綜合性產品,以時代、地域、類型為綱,廣泛、全面地搜集出土或傳世的歷代石刻資源,打造出一系列精品專題庫。其中,首發上線的“宋代墓志銘”專題庫即是與作者李偉國老師直接合作開發建設的。作者全面搜集了宋遼金元時期不同類型的墓志文獻,采用古籍整理標準進行全文錄文,包括文字隸定、句讀標點和釋讀校勘等,并對墓志的時間、作者、主題詞(志主)等關鍵信息進行標引;“籍合網”經過標準的數據結構化處理和入庫,實現全文瀏覽、多維檢索及分類導航等專業功能。除初編上線的8000余篇為作者前期積累成果外,從二編起均是陸續出土或公開的墓志文獻,專題庫以平均每編2000篇的速度進行增補,配合拓片圖像的共同展示,形成了“宋代墓志銘”系列精品成果。

宋代墓志銘錄文

基于專題庫分期建設的思路,《中華石刻數據庫》打造出古籍專業整理成果“一步式”數字出版的成功范式。這一模式有效縮短了發布周期,擺脫了以往石刻匯編作品受制于印制周期而導致的成果滯后、供需不匹配的困境;在保證質量的基礎上,作者可以結合前沿信息和研究進展,在第一時間對數據庫成果進行修訂、拓展,并以最快的速度進行發表。專業整理成果的數字化發布,不僅符合石刻文獻的動態發展特性,還在提高時效性和實用性的同時,有效降低了更新成本。

此后,進一步發揮內容選題策劃優勢,廣泛與作者合作開拓專題數據庫,除《中華石刻數據庫》外,還發布有《歷代進士登科數據庫》《殷墟甲骨文數據庫》《中華書法數據庫》《小學文獻數據庫》等產品,收錄了7萬余篇石刻資源、10萬余條歷代登科人物信息、14萬余條甲骨文卜辭、1萬余種書法作品和其他專題資源,加速了大型古籍整理成果的問世。

3.提供知識賦能

過往,數據庫產品被理解為已有資源匯聚的產物,用戶亦滿足于一些基礎服務,比如可以在一個使用場景下查看大量資源,解決采購、存藏多種圖書的問題;又如可以通過快速檢索,減少手動查找、翻閱的時間等。然而,伴隨著產品數量、建設主體的不斷豐富與拓展,以資源搜集、類聚為核心的數據庫已經逐漸成為最基礎的產品形式。在這一趨勢下,配合“籍合網”的整體發展,數據庫產品也努力向知識化方向延伸,提供超越文獻本身的專業服務。

一方面,從產品選題角度更加傾向知識成果的收錄。例如,同樣采用專題庫方式建設的《歷代石刻總目數據庫》,便側重提供石刻文獻的知識服務。《歷代石刻總目數據庫》基于石刻內容不僅逐一提取了題名、主題詞、責任者、卒葬時間、存藏地點等基本信息,還進一步完成細化標注;同時全面整理了與石刻相關的文獻資料,不僅有石刻類史料和現代匯編圖書,更擴展至考古發掘報告(含簡報),記載志主生平的正史傳記、文集、筆記和類書等傳世史料,現代學者的專題論著等,為每一方石刻制作一篇“文獻綜述”,提供了重要的文獻梳理服務;針對石刻中的墓志文獻,著力考證了志主之間的親屬關系,建立墓志文獻內部的家族譜系關聯,實現重要的信息拓展。

上述“文獻綜述”和“家族關聯”內容均非文本內的顯性信息,需要作者憑借扎實的文史功底進行考證和搜錄,是切實的知識服務;通過和《中華石刻數據庫》的功能打通,達到知識與文獻配套服務的最佳效果。

另一方面,在知識賦能的過程中追求知識本身的生產。立足數據庫等產品前期數十億字的大數據積累,基于人工智能、文本挖掘等機器深度學習技術的發展,“籍合網”古籍全流程智能化整理初步成型。已開發上線的古籍光學字符識別(OCR)、自動標點、繁簡轉換、專名標引等技術工具,有效支持了數據庫產品的內容建設,使原本短時間內無法問世的古籍整理成果借助數字化手段迅速提升效率,通過數據庫形式進行發布;與此同時,不同數據庫產品結合自身資源特點,也將部分智能技術工其引入產品功能當中,通過不同接口形式提供全新的智能化知識服務體驗。

古籍數據庫發展前景

當前,“籍合網”著眼于全流程古籍數字化整理與應用,打通了人才培養、科技賦能、版權保護、內容編輯、知識加工、成果展示等各個關鍵節點,將各個業務模塊作為一個整體有機組織起來,相互驅動、共同增益,逐漸打造出一個開放、創新的古籍整理業態,促進了跨學科、跨領域的交叉研究及相關應用成果的落地。

2022年以來,伴隨著ChatGPT、DeepSeek等大語言模型的問世和蓬勃發展,“百模大戰”如火如茶,國內各大企業和研究機構推出了超過200種通用和垂直領域的大語言模型,針對古漢語領域,也先后發布“荀子”“九思”“AI太炎”等成果,彌補絕大多數中文大模型能力評測基準都未將古文處理能力納入評測體系之中的不足。聚焦垂直領域的應用效果,目前中文大模型已經推進至更加細化的層面,例如中國古代農業方向就發布了其專有的大語言模型“齊民”。大語言模型具備強大的自然語言處理能力,使得大眾在智媒時代和古籍進行“深入對話”成為可能,現下已形成一定的應用場景,包括字詞釋義、文白翻譯、知識問答、語義檢索等。

《中華經典古籍庫》合作單位

未來,大語言模型和古籍文獻的結合勢必成為一種趨勢,甚至可能會對后者的整理研究路徑產生結構性影響。如何將大語言模型的計算能力轉化為知識生產能力,利用技術手段解決古籍整理的痛點問題,進一步實現數據的結構化;如何將大語言模型的應用場景與實際用戶需求相結合,平滑內嵌至檢索、閱讀的服務當中,實現有效的人機互動;如何合理規避大語言模型造成的\"人工智能幻覺”,使其生成的內容真正納入專業領域認可的范疇,達到“觀天下書未徧,不得妄下雌黃”(顔之推原著、王利器集解《顔氏家訓集解》卷第三《勉學第八》)的效果,是推進古籍數據庫產品優化升級最為重要的方向。

作者系古聯(北京)數字傳媒科技有限公司產品部主任

猜你喜歡
古籍整理石刻古籍
讓古籍在智能時代煥發新生
數智時代下公共圖書館古籍文獻傳承性保護與活化利用研究
《蜀道石刻題記》復音詞考釋五則
中國故事(2025年4期)2025-08-13 00:00:00
基于項目式學習培養中學生家國情懷素養的實踐運用
求知導刊(2025年18期)2025-08-12 00:00:00
大足石刻石篆山危巖體穩定性評價及加固方案
2025中華古籍保護志愿行動山西行啟動
科學導報(2025年49期)2025-08-09 00:00:00
數字化背景下古籍文獻保護與利用策略探討
蘭臺內外(2025年20期)2025-08-05 00:00:00
山西博物院展出近500冊古籍善本
主站蜘蛛池模板: 久久视精品| 91在线中文| 久久黄色小视频| 亚洲AV免费一区二区三区| 免费国产不卡午夜福在线观看| 成人va亚洲va欧美天堂| 久久精品66| 91久久国产成人免费观看| 亚洲成人一区二区| 欧美一区精品| 亚洲中文字幕23页在线| 青草娱乐极品免费视频| 久久美女精品国产精品亚洲| 国产永久无码观看在线| 夜精品a一区二区三区| 欧美天堂在线| 久久一级电影| 国产欧美精品一区二区 | 在线a视频免费观看| 在线观看无码a∨| 91久久夜色精品国产网站| 国产精品美乳| 2021国产乱人伦在线播放| 中文字幕亚洲专区第19页| 精品无码一区二区三区在线视频| 国产在线观看一区二区三区| 婷婷六月综合| 亚洲成人黄色网址| 亚洲三级成人| 亚洲大学生视频在线播放| 婷婷成人综合| 国产成人精品无码一区二| 看国产毛片| 一级做a爰片久久毛片毛片| 国产一区二区三区日韩精品 | 国产日本欧美在线观看| 精品久久久久久中文字幕女| 午夜精品区| 国产免费黄| 青草视频网站在线观看| 怡春院欧美一区二区三区免费| 亚瑟天堂久久一区二区影院| 中文字幕人妻av一区二区| 高清无码手机在线观看| 亚洲中文精品人人永久免费| 亚洲第一成年网| 久久精品日日躁夜夜躁欧美| 欧美一区二区精品久久久| 综合色天天| 免费A级毛片无码免费视频| 亚洲熟女中文字幕男人总站| 国产日韩精品欧美一区灰| a级毛片一区二区免费视频| 美女一区二区在线观看| 99视频全部免费| 欧日韩在线不卡视频| a欧美在线| 国产精品区视频中文字幕| 高清无码一本到东京热| 无码综合天天久久综合网| 国产精品熟女亚洲AV麻豆| 久久99国产精品成人欧美| 亚洲男人天堂久久| 色综合网址| 91黄色在线观看| 天天摸天天操免费播放小视频| 亚洲av综合网| 乱人伦99久久| 国产啪在线| 99人体免费视频| 美女免费黄网站| 亚洲一区二区精品无码久久久| 日韩精品一区二区三区免费在线观看| 91 九色视频丝袜| 亚洲免费人成影院| 免费三A级毛片视频| 国产精品网址你懂的| 在线观看国产网址你懂的| 国产在线高清一级毛片| 88av在线| 在线看片中文字幕| 国产农村妇女精品一二区|