劉玉柱
在數字出版的建設中,出版信息資源建設是基礎。出版信息資源系統為出版內容資源的積累、處理、保存提供了有效的工具。正因如此,出版內容信息資源系統的建設在各出版單位方興未艾, 使得各出版單位擁有的電子資源日益豐富,各種形式內容的數字資源層出不窮。但與此同時,出版內容信息資源系統的多樣性使用戶在使用過程中越來越感到不便,因為各種數字資源都有自己的數據結構、組織方式、查詢方式以及顯示界面,用戶為了查準、查全所需要的資料,不得不分別進入不同的查詢系統,不得不熟悉不同的檢索方式和顯示格式。
形成這種結果的原因是由于出版內容資源系統建設的不同步以及采用技術及標準的不同造成的,因此出版信息資源亟待整合,以實現出版業跨平臺全文庫信息系統建設。
傳統出版信息資源系統建設存在的問題
我國傳統出版信息資源系統建設的問題很多,歸納起來主要有以下幾點:
一是重保存輕服務。例如,出版社在圖書的編輯加工過程積累了大量的信息,這些信息隨著圖書出版活動的完成而積淀在出版信息資源系統中,不能為今后的出版活動所充分使用,也不能與其他出版社、新華書店等實現信息的共建共享,亦不能為讀者提供附加的服務。
二是“信息孤島”現象嚴重。各類出版活動所產生的數據,大都散落在單位和個人手里。保存這些數據的信息資源系統和其他的信息資源系統基本上是不關聯的,更談不上有關出版信息資源系統的硬件資源、智力資源的高效利用和整合,致使許多部門重復獲取本來已有的數據。
三是國家對出版信息資源系統的整合缺乏宏觀的規劃和指導。目前國家對基礎性、公益性出版數據共享的投入明顯不足,沒有形成完善的數據交換標準體系和強有力的共享服務技術支撐體系。在國家層次上缺乏宏觀管理與協調,缺乏配套政策、法規體系的有力保障。
四是對版權和商業機密缺乏有效的保護、監督措施。由于缺乏版權保護制度和技術強有力的支持,對有關保密的問題也沒有詳盡的措施,使得許多出版單位不敢進行出版信息資源的整合。
五是缺乏對出版內容資源深層次的揭示。傳統出版信息資源平臺,大多數只是一般的出版物外部特征數據的歸檔,再加上一些簡單的分類和索引,在內容揭示上只是做一些簡單的文摘等等,出版物內容和內容之間沒有深層次的關聯和揭示,沒有從元數據的層次進行基礎層面的揭示。也就是說,出版信息資源系統不僅要揭示文獻的參考關系,更要揭示概念的參考關系。
出版信息資源整合模式的分類
可分三類:一是原始文獻資源整合,即在某數據庫檢索的基礎上,根據自身電子資源情況與不同的系統自動建立適當鏈接,從而可以從不同的數據源獲取原文信息。二是元數據整合,此方式是目前開放數據常用的一種整合方式,具體方法是通過各種元數據收割技術從原始出版單位那里收割元數據,收割的元數據帶有原始出版物鏈接。將所有元數據集中供用戶統一檢索,如果需要原文通過原文鏈接獲取全文信息。三是虛擬整合,構建一個虛擬整合服務器,用戶由統一界面向虛擬整合服務器發送請求,由虛擬整合服務器按照一定配置向合適的系統發送請求,虛擬整合服務器將合適系統返回的結果按一定模版進行解析,并將最終結果返回用戶。
出版信息資源系統整合的策略
在新聞出版總署統籌規劃下,制定出版信息資源數據共享政策法規,完善數據共享管理體系,將各部門、單位積累的數據納入國家數據共享統一框架,開展共享技術與標準和政策法規研究。完善版權保護法規體系和共享數據收費價格體系。具體策略是:
1.根據不同的情況采用多種信息資源共享方式。對國家擁有、產生和國家投資產生的出版數據納入到“完全與開放”共享管理體制,對各出版單位投資產生的數據納入到“平等競爭”市場化共享管理機制。
2.國家可考慮通過建設國家級出版數據中心群和出版數據共享網,保障出版數據更新和共享渠道的暢通。
3.國家需加強對出版數據質量和標準的管理,特別是對新型出版物形態出版格式標準的制訂和修訂工作。
4.借鑒國際上數據整合的技術和經驗。 如世界數據中心(WDC)和國際科學技術數據委員會(CODATA)的標準和經驗。
5.探索好的盈利模式,使數據共享進入一個良性發展的軌道。
總之,我們要充分利用好標準化這一有力武器,做好出版行業信息資源系統的整合工作,從而使各出版信息資源系統形成合力,在促進我國新聞出版信息化建設中起到真正的基礎支撐作用。