陳文韜



籍資源數字化開發與利用是新時代古籍整理出版的新趨勢和新方向。目前古籍資源數字化的主要類型有原典的數字化和古籍整理成果的數字化兩種,面臨缺乏整體規劃、古籍整理成果資源有限、缺乏統一的數字化標準、尚未形成明晰的盈利模式等主要問題。未來應當加強對古籍資源數字化的行業監管和引導,進行項目資助,建立古籍資源數字化版權保護規章制度,加強古籍資源數字化人才培養,加強多種途徑的嘗試,探索古籍資源數字化的更多可能性。
古籍資源數字化是指利用現代信息技術對古籍文獻進行加工處理,使其轉化為電子數據形式,通過光盤、網絡等介質保存和傳播。古籍資源的數字化開發和利用,已經成為古籍整理出版的新趨勢和新方向。
古籍資源數字化
開發與利用的現狀
一是對古籍善本的原物掃描和原樣復制。海內外各圖書館和其他收藏機構進行了大量的古籍原典數字化的工作,很多古籍善本通過掃描制作成圖片的方式,實現了網絡存儲、查詢、下載和共享,對我們接觸和研究古籍文獻提供了極大的便利。如國家圖書館出版社近年來開發的“中華再造善本數據庫”,便將“中華再造善本工程”中影印出版的珍貴古籍善本進行圖像數字化,并通過對珍貴古籍善本的數字化加工和多元應用,實現珍貴古籍善本的再開發和再利用,是一個具有重要學術研究價值的古籍數字資源平臺。
二是用數字化的形式展現古籍整理的已有成果,發布專業文本供讀者瀏覽,還可實現多功能檢索。經過多年的努力,出版機構尤其是專業古籍出版社積累了大量的古籍整理出版成果,將這些古籍整理出版資源數字化,提供網絡閱讀和檢索服務,將使古籍整理出版成果得到更廣泛的利用。由中華書局下屬古聯(北京)數字傳媒科技有限公司開發的“中華經典古籍庫”,便在這一方向進行了很好的實踐,取得了一定的成績。“中華經典古籍庫”收錄了中華書局及其他古籍出版社出版的整理本古籍圖書,涵蓋經史子集各部,包含了“二十四史”、“史料筆記叢刊”、“古典文學基本叢書”、“佛教典籍選刊”、《資治通鑒》、《新編諸子集成》、《清人十三經注疏》等經典系列。“中華經典古籍庫”提供了豐富的古籍數字化閱讀、檢索服務以及必備的輔助工具,特別提供了文本數據與原書圖像的對照,并能自動生成引用格式,便于了解版式信息,省去了核對紙書的麻煩,為用戶帶來了便利。
古籍資源數字化
開發與利用面臨的問題
1.重復建設的情況嚴重
除了“中華再造善本數據庫”“中華經典古籍庫”這些較為知名的古籍數據庫之外,還有大量的機構在進行古籍資源數字化的工作,如“中國哲學書電子化計劃”“書同文古籍數據庫”“中國基本古籍庫”“國學寶典”等等。由于缺少統一的規劃,這些數據庫出現了重復建設的問題。一些熱門古籍不斷重復地被不同的數據庫進行數字加工,如多個數據庫都收錄了《四庫全書》和《二十五史》;數字化成果質量良莠不齊,既有可以代表古籍整理較高水平的數字化資源,也有粗制濫造的簡單圖片掃描。總體來說,結合校勘、輯佚等深度整理的精良本的數據庫較少。
2.古籍資源數字化缺乏“源頭活水”
古籍原典數字化面臨較為嚴重的資源限制。以各大圖書館為代表的收藏機構保存了大量的古籍善本,其中不乏稀見文獻資料。但大部分收藏機構將這些古籍資源視為自己的獨有資源,不愿輕易示人,更不要說進行數字化傳播了。因此,受資源壟斷的限制,一些珍稀古籍文獻和善本得不到進行數字化的機會。古籍整理成果資源有限。數字化的古籍應該是經過認真整理的古籍,需要運用目錄學、版本學、校勘學、文字學、音韻學、歷史文獻學等各方面專業知識進行點校,成為現有最好或較好的版本。否則,將會造成謬誤流傳,劣本取代善本。但目前流傳的古籍數字化資源,有很多是未經專業整理的粗制濫造的版本。目前“中華經典古籍庫”收書2300余種,12.6億字,預計再經過數年的努力,可以達到5000種、20億字的規模。這一數據相較我國現存的古籍圖書規模,屬于九牛一毛、冰山一角。制約“中華經典古籍庫”規模的最大因素,在于優質古籍整理成果的匱乏。
3.缺乏統一的數字化標準
各機構開發的數據庫都有自己的數字化標準,沒有形成統一的跨平臺接口。古籍資源數字化的技術標準必須符合中文古籍的特點。古籍數字化流程中,數據采集標準規范、圖像采集處理規范、文字采集規范、資源內容表示規范、古籍用字標準、專有名詞標準、整理本古籍元數據標準、整理本古籍文獻數據標注標準等等,都必須符合中文古籍的特點。目前國內對古籍數字化缺少統一的行業標準,各數據庫自行制定的標準存在較大差異,導致各數據庫的質量良莠不齊,也不利于不同數據庫之間的合作開發與利用。
4.尚未形成很明晰的盈利模式
進行古籍資源的數字化,需要投入大量的人力、物力和財力,并且周期長,投資回報率不高。從目前來看,古籍資源的數字化尚處于探索期,并未形成明晰的盈利模式。由出版單位開發的各類數據庫,主要依靠圖書館、高校等專業組織的購買,難以形成廣泛的零售需求,很難擴大銷售規模,難以帶來巨大收益。以“國學大師”“書格”等為代表的共享數據庫,主要通過收取網站廣告費、網友捐贈、移動硬盤拷貝資料銷售等方式來維持運營,未能找到更好的盈利模式。
對古籍資源數字化
開發與利用的建議
1.政府部門設立相關機構,加強對古籍資源數字化的行業監管和引導
制定古籍資源數字化發展規劃,協調各出版機構的古籍資源數字化工作,整合各出版機構的優勢資源,可以避免同質化重復建設。主管部門制定統一的古籍資源數字化標準,建立跨平臺、跨數據庫的統一接口,使各數據庫能夠實現跨平臺資源檢索和使用,充分實現各平臺優質資源的共享。
2.在古籍資源數字化盈利模式尚不明晰的情況下通過項目資助的方式,對古籍資源數字化進行引導
為古籍資源數字化提供必要的資金支持。以項目資助的方式,引導圖書館等收藏單位將已有古籍善本進行數字化開發和利用,鼓勵圖書館進行稀有古籍善本的數字化開發和網絡共享,使更多研究者和讀者能夠通過數字化平臺接觸古籍善本影像資料,實現對古籍善本的有效保護和利用。通過資金扶持,引導出版機構進行古籍整理出版資源的數字化。鼓勵出版機構加大古籍整理工作力度,整理出版更多古籍善本,為古籍資源數字化不斷提供新的古籍整理優質內容。此外,還可以通過稅費減免等方式,降低古籍資源數字化機構的運營成本,鼓勵更多的企業參與到古籍資源數字化工作中來。
3.對古籍資源數字化版權進行有效保護建立古籍資源數字化版權保護規章制度
古籍資源數字化存在難制作、易被侵權的問題。應當做好古籍資源數字化版權登記,加強對古籍資源數字化版權的保護力度,嚴厲打擊侵犯古籍資源數字化版權的行為。
4.加強多種途徑的嘗試探索古籍資源數字化的更多可能性
除了古籍原典的數字化、古籍整理成果的數字化這兩大最主要的古籍資源數字化途徑之外,我們還應積極嘗試更多可行的途徑。(1)古籍的數字化整理。古籍的數字化整古理可以通過數字化平臺實現古籍的自動校勘、自動標點、自動編纂、自動注釋、自動索引、自動排版等功能,可以極大提高古籍整理出版工作效率,并降低人力成本。筆者相信,在技術不斷成熟和完善的基礎上,古籍的數字化整理必將成為古籍整理出版工作的新動力。(2)古籍資源的數據庫開發與利用。目前大多數的古籍數據庫還處于“資料庫”的階段,只能提供較為簡單的檢索和閱讀服務。而古籍資源的數據庫采用社會科學的方法論和電腦運算工具,如超文本、資料視覺化、統計學、文本探勘、數位制圖等,實現運算、分析、統計等功能,可以將古籍資源進行更深入的開發和利用,產生新的價值。(3)古籍資源的融合出版。古籍出版單位可以在紙質圖書中加入AR、VR等新技術,使閱讀體驗更加豐富,更加富有層次。如對文博考古類圖書中出現的圖片進行AR處理,使圖片中器物的細節更加豐富立體;對圖書中展示的考古發掘現場進行VR展示,使讀者能進行全方位、多角度的觀看,如身臨其境。
(湖南岳麓書社有限責任公司)