洪濤?陳必佳
【摘要】近年來,我國的數字出版業迅速成長,在融合發展和產業化道路上不斷探索。古籍出版領域的數字出版資源豐富,但其在產業化模式方面受眾少、專業性強,難以打開局面,需要密切配合技術發展、人才培養等環節以形成聚合效應。中華書局在10余年前就開始古籍數字化的探索,為此成立古聯公司專注古籍數字出版,在公司業務發展中摸索并形成了可持續的產業化模式,完成了將古籍數字化技術應用到古籍整理數字化出版的產業實踐。
【關? 鍵? 詞】古籍數字化;古籍數字出版;產業化模式
【作者單位】洪濤,古聯(北京)數字傳媒科技有限公司;陳必佳,古聯(北京)數字傳媒科技有限公司。
【中圖分類號】G255.1【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.13.009
中國的傳世古籍浩如煙海,是中華民族歷史和文化傳承的重要載體。新中國成立以來,國家高度重視古籍整理出版工作,成績斐然。隨著信息時代的到來和數字化浪潮的興起,傳統出版業的數字化轉型成為時代趨勢[1]。以知識服務為代表的服務模式與技術創新持續發展,融合出版和產業化運營成為出版領域共同關注的話題[2]。在數字化轉型過程中,各出版社因分工不同而有不同的轉型方略[3]。古籍數字出版在摸索中起步,逐步形成了成熟的生產流程和產業化模式。
在數字出版的專門領域,如何形成可復制、可操作、可持續的產業模式,并保持其有效性、營利性,是出版業熱切關注的問題。當前,古籍數字出版依舊面臨諸多困境,如受眾范圍小、市場規??赏卣箍臻g有限、投資規模大、投資回報周期長等。產業結構模式轉型是出版業在數字經濟時代行業轉型的有效路徑之一[4]。從目前的數字出版產業來看,產品種類繁多,產業的內涵和外延逐步豐富,產業鏈和產業規?;饾u形成。如何更高效率地生產古籍整理數字化產品,更大范圍地滿足用戶需求,讓古籍數字出版業務在現有市場環境下持續良性發展,是古籍整理從業者和古籍數字出版從業者共同關心的話題。
本文結合中華書局古聯(北京)數字傳媒科技有限公司(以下簡稱“古聯公司”)在古籍數字出版產業化發展道路上的經驗和實際情況,概括構建古籍數字出版產業鏈的總體思路:充分開展高質量的內容建設,為讀者打造數字化內容精品;通過技術創新、打造眾包平臺、開展人才培訓服務等形式,打造線上古籍整理和數字化產業鏈,進一步推進內容生產。
一、古聯公司的發展歷程及資源利用
1.發展歷程回顧
古聯公司脫胎于中華書局“古籍資源部”,成立于2015年8月,承擔古籍數字化項目建設及相關數字產品的研發和推廣工作。古聯公司正式成立之前,古籍資源部早在2003年就開始古籍數字化工作的探索。經過10余年的準備,古籍資源部在2014年6月發布了中華書局推出的第一個古籍數字化產品——《中華經典古籍庫》鏡像版?;趯π聲r代數字技術發展的展望和對古籍數字出版產業發展的預期,次年10月,中華書局結合古籍整理出版的核心業務要求,將原古籍資源部改組,成立古聯公司。在新的經營模式下,中華書局的古籍數字化工作進入高速發展階段,結合數年的實踐經驗,產業化模式的框架和思路漸趨清晰。2017年7月,古聯公司建立新聞出版業科技與標準重點實驗室——古籍數字化與知識工程重點實驗室,重點投入標準建設、自然語言處理、知識組織、技術開發,致力于解決我國古籍整理數字化與知識服務中的關鍵問題,確立了在古籍數字化領域的專研地位。
2018年4月,作為古籍整理出版資源平臺的籍合網發布,古聯公司開啟了以此為基礎的平臺化建設。同年,籍合網在線眾包編輯校對的工作模式全面啟動,將古籍數字化與傳統出版產業的工作流程相結合,加快大型項目的編校速度,服務紙書出版和數據庫建設。從2020年起,一批古籍智能整理技術工具逐個落地,并廣泛服務于古籍整理與編輯出版業務。2021年,致力古籍整理專業人才培訓的平臺籍合學院上線,該平臺培訓內容注重學術專業性和實踐操作性的結合,在產業化服務中承擔起為古籍整理出版建設人才梯隊,并持續性輸送人才的任務。至此,古聯公司沿著中華書局進行古籍整理出版的脈絡開展數字化工作,并完成了將古籍數字化技術應用到古籍整理數字化出版的產業實踐。
2.充分利用資源,打造數字精品
《中華經典古籍庫》是古聯公司用以打造品牌效應的核心產品,該優質產品帶來了用戶和收益,也為古聯數據庫業務奠定了良好的基礎。《中華經典古籍庫》包括鏡像版、網絡版和微信版三種形態,其各自的運營和維護特點不同:鏡像版是將產品部署在用戶本地,在銷售初期表現最好,符合廣大國內機構的采購特點和需求;網絡版的建設隨著海外市場的開拓逐步發展起來,其突出優點是開通試用便捷,有利于數據統計和分析,更新服務及時;微信版針對個人用戶,是市場上第一個可以通過微信公眾號直接使用的大型古籍數字化產品,用戶在“經典古籍庫”微信服務號里可以進入《中華經典古籍庫》進行檢索和閱讀,從市場角度來看,微信版的突出特點是售價低廉、使用靈活、傳播快捷,在創造口碑、拓展用戶方面發揮了重要作用。
《中華經典古籍庫》充分利用中華書局優秀古籍整理出版成果,通過版權合作,將兄弟出版社的整理本古籍進行數字化并整理入庫。數據庫的發布標志著中華書局的古籍數字出版工作走向市場,開啟全新的業務版圖。2018年,《中華經典古籍庫》獲得第四屆中國出版政府獎,在推動媒體融合發展、服務公共文化建設方面獲得了高度認可。截至2022年底,《中華經典古籍庫》上線資源22.5億字,其中超過10億字的資源來自中華書局以外的23家出版社。古聯公司積極與各家古籍出版社進行資源合作,通過市場化運作,保證各出版社利益,將《中華經典古籍庫》打造成全國性的古籍整理出版成果數據庫。在出版成果的聚合與數字化之外,古聯公司尤其重視原創性古籍數據庫的開發,這也是今后古籍數字出版的生命力所在。
古聯公司始終注重古籍數字化產品的質量,在通過數據庫真實反映原書面貌的前提下,盡可能通過技術手段和工具為讀者使用及閱讀提供方便。在內容顯示方面,數據庫對標題、正文、注釋內容進行嚴格區分,對書名、專名的顯示加以處理,同時提供原書圖像和文本頁面的對照、標題目錄到正文的鏈接、注號到注文的鏈接。在檢索方面,數據庫具有繁簡字關聯檢索、忽略特定字符數的模糊檢索等功能,提高了讀者的使用效率。
3.擴大資源合作,拓展選題思路
古聯公司的內容服務充分利用已經整理出版的紙書資源和學術作者資源。古聯公司核心的數據庫業務模式可以分為兩種:一種是以古籍整理圖書為對象的古籍數字化業務模式,將已有的古籍整理出版成果整合成數據庫的形式服務用戶;另一種是獨立于紙書出版的古籍數字出版業務模式,將古籍文獻通過數字化加工和整理后直接呈現在用戶眼前。
古籍數字化業務模式接近于紙質出版物的升級和增值服務,而數字化只是紙書出版流程完成后的再加工。出版社出版的古籍整理圖書通過數據編輯完成數字化,通過分類重組打包形成獨立的數據庫產品。除《中華經典古籍庫》外,籍合網上的《中華古籍書目數據庫》《中華文史學術論著庫》等產品也是對已出版紙質出版物的重新加工整理,是依據市場定位形成的服務于不同讀者的專題數據庫。這種模式的數字化業務與中華書局的傳統出版業務密不可分。
古籍數字出版業務模式獨立于紙書出版存在,可以稱之為古籍數字出版。其最鮮明的特點是不依賴于已有的古籍整理出版成果,直接利用歷史文獻進行開發,形成原創性的古籍專題數據庫,因此能夠彌補已出版資源的不足。這類數字出版物具有專業性強、主題明確的特點。近年來涌現的各家大型古籍數據庫產品,給人文領域的學術科研帶來了方法論的變革,學術機構和公共圖書館都在努力推進館藏資源數字化,并購買各類數據庫等電子資源供師生使用。數據資源的海量化不可避免地帶來內容的冗余,這既給個人用戶檢索資料帶來干擾,也增加了不必要的采購成本。同時,數據庫的生產者為滿足數據海量的需要,被迫減少了針對主題資源的個性化設計和功能性服務。古籍數據庫雖然給讀者帶來了便利,但弊端也日益明顯??紤]到不同用戶的專業化與個性化需求,古聯公司深入專題數據庫的制作和研發,目前已經與十幾位作者簽約合作,制作完成的專題數據庫涉及地方文獻、口述歷史、古代人物、出土文獻、藝術與民俗等內容,代表性的數據庫有《歷代石刻總目數據庫》《歷代進士登科數據庫》《陜西文獻集成數據庫》《殷墟甲骨文數據庫》等。古聯公司通過與作者的合作研發,突破了出版社資源限制,打開了古籍數字出版的局面,提升了核心競爭力。
上述兩種業務模式分別對應“出版數字化”與“數字化出版”兩個概念,都是數字出版的衍生含義,強調資源的整理、組織、聚合,以滿足用戶的內容消費需求為目的。前者是傳統出版業在內容和形式上的延伸或擴展,后者不僅是出版介質的變化,更涉及生產方式、流通方式、銷售方式的變化,以及出版組織形式、人才評價機制和考核體系的變革,是一種持續創新的產業形態[5]。古聯公司成立以來,數據庫產品從單一的《中華經典古籍庫》系列發展到31個數據庫,與23家出版社、13位作者開展版權合作,生成古籍整理成果30多億字,涵蓋專業古籍整理出版資源22.5億字,石刻資源5萬余篇,歷代登科人物10萬余條,木版年畫18000余幅,書法作品10000余種,甲骨文卜辭143856條(數據截至2022年12月)。上述資源聚合在一起,構成了全國最大的整理本古籍資源數據庫。古聯公司通過多年資源積累與產品研發,為客戶提供了便捷的數據庫服務、多元的使用場景。截至2022年12月,古聯公司擁有數據庫機構用戶150余家,服務個人用戶20萬人。
二、古聯公司古籍數字化技術工具的開發與應用
1.技術工具
數字化出版最重要的特點就是利用技術工具進行編輯和數據處理。在業務發展的過程中,古聯公司始終注重技術研發,開發了包括繁簡轉換、OCR文本識別、自動標點、專名標引等在內的一系列技術工具。智能化工具在傳統古籍整理工作中表現不凡,技術工具的準確率不斷提高,大大節約了古籍整理過程中的人工成本。目前,針對古籍整理的自動標點、繁簡轉換、命名實體識別的準確率已經可以有效地輔助閱讀,為古籍整理提供幫助。OCR識別系統也在多個出版社進入大規模產業應用階段。
2.眾包平臺
古籍整理眾包平臺在2018年開創古籍整理編校眾包的工作模式,2020年正式上線能在移動端分發任務的i編纂小程序。在線眾包平臺和移動端小程序雙線并進,展開了大量包括校對底本、引文核查、編輯整理、圖像處理編排等在內的工作,極大地推進了古聯公司的數據庫開發進度,為中華書局等多家出版社提供了編校支持。
古籍整理眾包平臺包括編輯器和業務管理系統兩大部分。編輯器對接文獻處理工具,用戶可以在線編校稿件。業務管理系統承擔業務流程管理和用戶管理:業務流程管理包括線下文件切割、上傳任務系統、注冊用戶線上申領;用戶管理包括個人信息和工作能力的審核、在線合同簽訂,以及后續的質檢抽查。在實際的項目經驗積累中,古聯公司建立了穩定的在線眾包團隊,并進行分組細化管理。i編纂微信小程序在原有古籍整理平臺的基礎上增加了手機微信派單、用戶申領搶單的模式。同時,古聯公司還通過小程序中的個人工作排行、獎章標記等機制激勵編輯,通過其中的指定派單提高編輯的任務適配度和工作效率。
3.編校系統
古聯公司的數字化技術平臺服務于不同的業務流程。2022年,古聯公司將古籍整理相關技術工具整合成“古籍數字化整理平臺”發布,編輯可以上傳需要處理的古籍圖像,通過人工智能的OCR文本識別系統識別成文本,并在系統內開展校對工作,校對好的文本再由計算機通過自動標點、自動標引專名線等功能進行輔助處理。平臺還提供在線編輯功能,編輯可以進行文檔結構的標引和編輯工作,最終生成Word文檔或符合古聯公司規范的XML文件。針對古籍編輯,古聯公司還研發了文達編?!悄芫幮O到y。該系統用于幫助編輯核對引文,檢查文字規范、標點格式等常見錯誤,提高編輯的工作效率[6]。文達編校系統的開發疏解了古籍編輯的編校壓力,讓編輯更加關注稿件的內容質量。
4.標準建設
為保證質量,古聯公司配合眾包平臺的古籍整理工作建立了合理的資格審批和質量審核機制。在數據庫質量把控方面,古聯公司擁有包括《數據加工流程總規范》《編輯器數據整理工作規范》《元數據規范》等在內的26種數據加工及技術開發標準,以規范數據庫生產流程。這套數據加工及技術開發標準在2020年榮獲中國質量協會頒發的質量技術獎二等獎,如今已成為多家出版社古籍數字化出版的應用標準。
5.字庫和輸入法
在技術工具開發中,古聯公司注重古籍數字化的基礎能力建設,為配合不同類型的古籍數字化和出版需求開發了字庫和輸入法。其中包括通用的中華書局宋體字庫(13萬字)及輸入法,配合佛教文獻出版和數字化制作的梵文悉曇體字庫(7569字)、配合甲骨文文獻出版及數字化制作的古聯甲骨文摹寫字庫(15445字),字庫中的字形根據學術進展和資源數字化不斷修訂和更新。古聯公司還為用戶提供云字庫,用戶不需要下載字庫就可以在網頁上瀏覽古籍。
三、古聯公司人才培養業務的拓展及產業閉環的形成
數字出版領域的人才隊伍建設一直是出版領域討論的重要問題,除了招聘和對選拔人才環節的把關,對于專業性較強的領域,提供專門的培訓是出版單位人才管理的重要內容[7]。在資源、平臺、工具三者具備的前提下,古聯公司基于中華書局自身的內容和人才優勢,將古籍整理實踐和數字化時代下新的古籍整理出版要求相結合,建設培訓課程體系,拓展人才教育和培訓業務。2019年7月,中華書局主辦、古聯公司承辦了第一屆線下 “古籍整理編校研修班”?;顒酉⒐己蠓错憻崃?,來自全國550余位到場學員和2300余位線上學員參與研修。通過此次活動,古聯公司看到了古籍整理從業人員及讀者對培訓的迫切需求。隨后,古聯公司在籍合網平臺建立籍合學院,利用數字平臺拓展古籍整理業務。此外,古聯公司還專門組建培訓部,調集具有專業背景的編輯進行視頻整理和在線培訓平臺建設,為高校文獻學專業學生、出版社從業人員、大眾愛好者提供相關服務。
籍合學院在課程制作方面的合作對象主要是古籍整理經驗豐富的高校教師、出版社編輯、文博機構研究員。籍合學院的課程體系包含通識、技能、案例、專題4部分。通識課包含古籍整理基礎理論課程、文獻學基礎理論課程、通識性講座等內容;技能課從古籍整理及出版工作實務入手,幫助學員提高注釋、???、版本辨析等技能,并建立系統的知識框架,提供有實踐價值的觀點及方法;案例課圍繞案例進行復盤分析,邀請有整理及出版實操經驗和優秀成果的教師,為從業者提供最具指導價值的一手經驗;專題課講授古籍整理中常用、核心且具有一定難度的專題知識,完善從業者知識體系。
籍合學院目前主要針對三種類型的服務市場:大學課程合作、編輯繼續教育和大眾古籍整理愛好者的培訓。其中,古聯公司將籍合學院的資源和實踐項目與高校的教學活動相結合,嵌入教學體系,為高校等教育單位提供教育資源支持,隨著與高校合作的深入,培訓內容逐步拓展到課程共建、合編教材等產學研合作。目前,古聯公司已與多所大學開展課程共建工作,實現產品能力、課程資源與高校教師資源的優勢互補,同時借此深入高校教學體系中,挖掘更多的應用場景。
籍合網上的培訓平臺與眾包平臺相互呼應,形成了在線學習、考試、認證、實踐一體化流程。籍合學院的學員有一部分是古籍數據庫的用戶、讀者,具備一定培訓基礎的學員在通過考試認證等資質審核后,就能在古籍整理眾包平臺或者小程序分領任務,逐步參與古籍整理、校對、編輯,成為古籍整理編校的生產者,已經是眾包平臺成員的學員也能通過繼續培訓不斷提升自身的業務水平。讀者、學員與整理者的身份由此形成流動性——籍合學院的優秀學員加入整理者團隊,擴大古籍整理編校隊伍,提高古聯公司的古籍數字化的生產力,優秀的古籍數字化產品吸引更多的讀者成為籍合網用戶,從而形成產業閉環。
四、結語
內容是出版業的優勢,古籍數字出版應立足內容,以用戶和讀者的需求為中心,開發有深度、有溫度、符合市場需求的古籍數字化產品,利用科技賦能,促進融合發展[8]。古聯公司的產業模式發展充分立足中華書局古籍整理出版的歷史與經驗,以用戶需求為本,以社會效益和經濟效益均衡發展為目標,守正創新,尊重市場規律,形成了可持續、促發展的優質產業鏈。新時期,古聯公司將立足自身優勢和特長,結合實踐創新,探索產業融合發展更多的機會和可能。
|參考文獻|
[1] 安玉濱. 我國數字出版產業發展現狀及策略分析[J]. 黑龍江科學,2017(14):84-85.
[2] 張新新. 數字出版產業化道路前瞻:以專業出版為視角[J]. 出版廣角,2014(18):33-35.
[3] 繆宏才,周典富,嚴岷. 出版數字化轉型的思考與實踐[J]. 出版廣角,2022(5):61-64.
[4] 李海濤. 數字經濟背景下出版數字化轉型趨勢探究[J]. 新聞愛好者,2022(2):106-108.
[5] 王曦,李弘. “十四五”時期推進我國數字出版業務工作展望:基于生產力發展視角[J]. 出版廣角,2022(4):12-16.
[6] 徐仲莉. 構建智能圖書編校排系統,助力圖書出版數字化轉型[J]. 傳播與版權,2021(8):24-26.
[7] 肖麗娜. 信息化時代的數字化出版構想[J]. 傳媒論壇,2021(15):87-88.
[8] 楊中啟. “十四五”出版高質量發展的四個維度[J]. 出版科學,2022(4):5-13.