陳敏,饒志華,熊靖菊
(1.江西科技師范大學,江西南昌 330038;2.南昌師范學院,江西南昌 330032)
20世紀50年代以后,計算機技術、網絡技術、高密存貯技術逐步引領人類社會進入信息時代,知識信息成為社會發展的重要資源,數字資源成為知識創作、傳播和利用的一種常規形態。信息資源的價值主要是利用信息的可復制性來進行共享。按照信息科學理論,信息的交換是為了共享,是為了提高信息資源的利用率,從而節約社會成本。
2000年12月,美國國會撥款1億美元,啟動國家數字信息基礎設施和保護計劃(National Digital Information Infrastructure and Preservation Program),用于收集和存儲重要的數字資源?!?〕在2002年11月聯合國教科文組織頒布《數字遺產保存憲章》之后,國際組織和各國政府開始制定數字資源的長期保存政策,數字信息資源長期存儲成為戰略任務。國內學者也開始研究各種數字信息資源的采集與存儲,其中包括網絡資源、電子出版物、機構特色數字資源、個人數字資源和開放存取資源(OA,Open Access)等,而且由此延伸到國家政策、技術、知識產權、元數據、標準、模型建構等相關領域。
信息、物質和能量是現實世界的三大要素。其中,物質提供材料,能量提供動力。信息是物質間相互作用而形成的,是事物存在的形式,更是一種獨立的資源。對信息進行加工處理和開發后形成的信息資源,能夠充分實現信息的價值,發揮信息的效用。信息資源作為一種非天然形成的資源,具有非常強的目標導向性。與其他資源相比較,信息資源具有共享性、時效性、動態性、支配性、不可分性和不同一性等特征。
《數字遺產保存憲章》明確提出,數字資源是人類知識的一種特有的表達方式,是以數字形式存在的資源。數字資源既包括電子出版物、數字文本、數據庫、數字影音、數字圖文、軟件等組織形態的資源,也包括博客、電子郵件、日志等個人形態的資源。
共享性是信息資源的一種基本屬性。一方面,信息資源效用的實現需要通過共享來達成;另一方面,信息資源的共享提升了信息資源的利用率,避免了信息采集、存儲及管理上的浪費和重復勞動。信息資源具有外部公共性,可以無差別地復制和通過各種平臺交流,從而降低信息收集管理的成本,提升信息使用效率,實現社會效用的最大化。在現代信息社會,依賴于互聯網、數據庫和分享服務器,人們利用客戶端的信息終端能夠更高效地對信息資源共同管理,實現信息資源的最優化配置和快速分享。
信息的共享與利用,都需要利用特定的介質,即信息存儲在什么地方、信息資源附著于什么地方。信息存儲的方式伴隨著科技和社會發展而不斷變更。從遠古至今,人類把信息先后存儲于石塊、甲骨、金屬、絲帛、紙張、膠卷、計算機、虛擬的網絡之上。信息存儲方式的沿革,就是人類材料科學發展的歷史。信息存儲是信息系統的重要組成部分。信息儲存方式的高效與否,關系著信息檢索利用的效率。伴隨著信息技術的進步與發展,未來的信息存儲將使信息成為重要的資產,信息的高效存儲、備份、防災與恢復已經成為企業信息基礎設施建設的重要環節。
自上世紀50年代以后,信息技術引領了社會發展的方向,也日益深入到百姓的社會生活,改變了企業發展的路徑。特別是進入21世紀以后,信息技術相關企業取代了傳統的制造業,以微軟、谷歌、亞馬遜為代表的IT企業成為了公司排行榜上的大鱷,取得了巨大的財富。
在網絡時代,信息資源成為社會發展和競爭的重要戰略性資源,持續推動社會的可持續和全面發展。特別是大數據時代的來臨,海量的數據潮水般涌現,全球數據總量每年都以近50%的速度遞增,數字資源日益集中反映著時代的文化、科技、政治和經濟領域特征,逐漸成為網絡時代的社會信息資源的主流,塑造著各個國家的民族特征,保留著各個民族的記憶,日益體現出國家軟實力的競爭力?!稊底诌z產保存憲章》提出,數字資源已經成為子孫后代活動的資本和遺產。數字資源保存如果缺失的話,將會導致人們處于“數字黑暗年代(Digital Dark Age)”?!?〕
美國圖書館學會ALA(American Library Association)認為數字信息資源存儲是為了長期精確再現驗證數字內容以確保使用者能夠長期訪問和利用,存儲數字信息資源要避免資源不受媒體過時和技術變革的影響。歐洲數字保存聯盟則認為數字資源的保存是為了促進數字資源被用戶定位、再現、利用和理解,數字資源的儲存內容包括數字信息資源的名稱、地址。
以高校圖書館為例,從資源結構角度來說,數字信息資源的存儲包括資源載體(硬盤、云盤、錄音錄像帶等)的存儲、資源內容(以比特流來描述)的存儲、元數據的存儲和資源相關信息的存儲;從資源安裝角度來說,包括本地服務器上安裝的數字資源的存儲、遠程服務器但在本地做了鏡像的數字資源的存儲和僅僅提供通過帳號入口的數字電子資源的存儲;從資源內容角度來說,包括館藏數字資源的存儲、學位論文數字資源的存儲、電子期刊的存儲、電子圖書的存儲、數字科研資源的存儲、數字教學資源的存儲、館藏圖書的電子書目的存儲、文摘類數字資源的存儲和圖書館自建數據庫的存儲;從資源形式來說,包括文本數字資源存儲、圖像數字資源存儲、音頻數字資源存儲、多媒體數字資源存儲等。
人類社會發展過程中,知識創造是社會發展的核心推動力,人類社會的進步也伴隨著智力勞動成果的產生與推廣。為了更好知識創造,提升科技發展,有必要保護產權人的利益,推行保護知識產權制度。為保護產權人的利益,近年來,我國出臺了一系列政策文件:2017年4月24日最高法頒布實施《中國知識產權司法保護綱要》;2018年9月國務院頒布《關于加強知識產權審判領域改革創新若干問題的意見》;2019年11月國務院頒布《關于強化知識產權保護的意見》。
用戶通過進入公共信息資源平臺,使用已經公開的數字資源,雖然使用中不需要經作者的許可,但其知識產權依舊受法律保護,其版權歸于著作權人。關于數字化的學位論文版權歸屬,部分學者認為歸屬學位授權單位,但也有學者認為版權部分屬于論文作者,主要是看論文的撰寫過程對于授予單位資源的利用情況。根據《中華人民共和國著作權法》第16條,“主要利用法人或其他組織的物質技術條件創作,并由法人或其他組織承擔責任的職務作品”或者“合同約定的由法人或者其他組織享有的職務作品”,版權屬于機構,作者僅享有署名權。數字化的教學資源和科研資源這些職務作品,利用了學校資源并由學校承擔責任的,權利應屬于學校,其他的著作權為著作者,學校享有優先使用的權利;學校外購的數字資源中,內容資源版權歸屬于原著作人,數據庫版權歸屬于數據商。對于免費的網絡數字資源,要視具體情況而定,其中不受著作權法保護的資源不享受版權,受法律保護的則版權歸屬于著作人。根據《中華人民共和國著作權法》第13條,“作者身份不明的作品,由所有人行使著作權,身份確定的則由作者或者繼承人享受著作權”。此外,圖書館的數字書目資源,不具有版權意義,不受著作權法保護〔3〕。
傳統的高校圖書館資源存儲主要是紙質資源,以及部分音像資源、縮微資源、具有文物性質的其他媒介存儲形態的資源,如甲骨、絲帛、金屬器具等。這些傳統資源的保存主要是針對介質的保護:紙張的防蟲防火防潮的技術保護、音像縮微制品的電子產品保護和甲骨等的技術保護等。隨著信息技術的發展,數字資源成為圖書館保存的主要資源,更是圖書館讀者利用的主要資源。圖書館數字資源的存儲技術,既包括傳統資源轉換成數字資源的技術——掃描技術、網絡數字資源的采集技術,也包括爬蟲軟件技術、各種格式和動靜態存儲技術、資源安全存取技術、元數據技術和數據庫技術等資源的獲取加工技術,還包括數據備份技術、仿真技術、數據封裝技術、再生性保護技術、數據遷移技術等資源保護技術。
傳統資源的存儲經過社會的發展,已經積累了大量的經驗,具有成熟的解決方案,但是數字資源的保存依賴的是信息技術,而技術的發展具有諸多的不可測性,技術問題帶來數字資源存儲的極大不確定性。首先是數字技術的標準問題,以通信技術為例,1G到5G僅僅30年時間,技術的迭代非常迅速,導致各種標準變化多端。數字資源的存儲涉及許多技術標準,如元數據標準、系統模型標準、文件格式標準等,反映在存儲方面則為電子文檔格式標準、OAIS參考模型標準、電子文件歸檔標準等;與標準的變化類似,數字資源的存儲面臨更大的不確定性是技術的更新與過時問題,例如現在縮微文檔的存儲與閱讀、軟盤資源與光盤資源的存儲與閱讀等,都因為技術的過時已經非常難以使用。隨著技術的快速發展,軟硬件的變化極大,文件格式的過時、技術平臺的變更、資源的保存介質的淘汰等,都對數字資源的存儲帶來了極大的挑戰。
隨著信息技術的迅猛發展,讀者閱讀習慣發生了革命性變化,使用的資源逐步以數字化為主。數字化資源具有傳統資源所不具備的天然優勢——檢索便利、使用高效、存儲方便。因此,圖書館的資源建設必然地走向數字化。國家主管部門也因這種變化而開展了一系列相關建設,如90年代末啟動了CALIS系統(中國高等教育文獻保障系統,China Academic Library & Information System)建設。CALIS管理中心設在北京大學,下設文理、工程、農學、醫學四個全國文獻信息服務中心,華東北、華東南、華中、華南、西北、西南、東北七個地區文獻信息服務中心和一個東北地區國防文獻信息服務中心,提供聯機編目、電子資源導航、公共檢索、館際互借和文獻傳遞服務。
數字資源的數量每天都以巨大的速度增加,形成了浩瀚的電子資源海洋。根據統計,非科技文獻每30~50年增加1倍,科技文獻每10年左右增加1倍。隨著信息爆炸,資源的增長量更是巨大無比,按照EMC和IDC發布的《2020年的數字宇宙》預測,全世界到2020年數字信息資源的數據量將達到1000T。而且國外學術類期刊,國內訂閱的出版形式都是以網絡形式的電子期刊,國內的高??蒲泄ぷ魅藛T使用的資源也是以知網、萬方、維普為代表的電子出版物。如何解決這些海量數據的存儲,將是高校圖書館面對的一個巨大挑戰。在這些海量資源的存儲中,如何保障數據存儲中的數據安全、加強存儲數據的管理能力、提升存儲數據的現實可用性、保障存儲系統的可擴展性、保持系統的高效性都是必須考慮的問題,也是數字圖書館的關鍵技術問題。
英國聯合信息系統委員會(JISC,United Kingdom joint information systems committee)啟動的電子文獻的生命周期信息(LIFE,Life Cycle Information for E-Literature)項目,建立針對電子文獻的生命周期中資源的采集、整理、存儲及利用數學模型,進行整個數字資源的成本核算和分析,從而得出數字資源建設的成本。該研究項目提出,數字資源相關的成本包括資源建設成本、資源獲取成本、資源導入成本、比特流保存成本、內容保存成本、資源提供成本和非生命周期因素的成本。
與紙質資源的存儲成本相比,數字資源的存儲成本是一個長期的持續投入的過程。伴隨著海量資源的迅速增加,數字資源的保存將是一個非常昂貴的投入,需要國家在資金方面的支持,以實現數據的使用和資源的共享。在我國高校圖書館,國家要求生均年購紙質書不低于4冊,在大多數高校學生數量持續增加的情況下,圖書館為滿足學生閱覽座位和購買紙質書的費用,已經負擔極重,而數字資源存儲的投入將更加增加學校的經濟負擔。因此,數字資源的利用更應該加強館際協作,實現資源的共建、共知、共享。
數字信息資源日益成為社會發展的重要資源,數字資源的儲存也日益成為國家戰略的組成部分。高校圖書館的資源采訪和資源存儲,要適應由傳統的建設大樓大書庫保存紙質資源轉變為數字資源存儲方面的基礎設施建設。但是,數字資源存儲作為一個新生事物,不僅存在著諸多困難,如海量信息資源增長快、技術迭代快、標準不統一、成本收益不確定、存在知識產權風險等問題,還面臨著社會環境、文化環境和技術環境不斷變化的挑戰,需要政府、高校、數據商和IT企業等多個主體共同努力推動工作的開展和運行。
根據前面闡述的高校數字資源發展和所面臨的各種問題,筆者通過對國內外相關數字資源存儲方面的資料進行梳理,在此提出幾點建議和對策,希望能夠逐步緩解高校數字資源建設過程中出現的一些問題和不足。
第一,針對數字資源存儲中涉及的知識產權問題,要認真對待,妥善解決。在國家知識產權等有關法律的規定范圍內,積極做好與數字資源供應商或版權所有者的友好合作關系,通過簽訂各種形式的協議充分保證高校圖書館數字資源的保存權利。另外,進一步增強高校師生有關知識產權的法律意識和思想教育培訓,逐步建立健全數字資源保存的長效管理機制。
第二,針對數字資源存儲中涉及的技術發展方面的問題,可充分利用當前世界上普遍流行使用的區塊鏈、聯盟群等技術,進一步促進構建高校圖書館數字資源的協同與共享的管理體系,搭建相關數字資源信息的共享平臺。這既能提高高校圖書館數字資源的利用效率,又可以滿足一些特殊用戶的個性化需求,充分發揮數字資源的特色和價值。
第三,針對數字資源存儲中涉及的成本問題,建議從國家數字資源保存的管理體系和機制中探尋一種可以統一謀劃、分層設計、通力協作的一體化管理模式,加強高校與地方政府和社會各層次的協同與合作,國家起主導作用,全民共同參與,吸收國外有關數字資源保存的先進經驗,出臺我國數字資源保存的有利政策和法規,建立健全我國數字資源保存的管理體系。在數字資源的管理定位、選擇與保留的依據、有關數據的格式規范等方面著手,避免重復建設,實現資源共建共享,節約各種管理經費,保障數字資源存儲的成本可以得到有效的控制,使更多有價值的數字資源能夠得到長期有效的保存和利用。