馮海英 趙秀敏
隨著數字信息技術和互聯網的快速發展、數字信息的擴散和數字環境的形成,我國文獻信息服務正在全面進入數字時代,數字化圖書館是為了解決信息資源的有效利用,今年數字圖書館產生了大量的數字資源。數字圖書館的優越性使越來越多的圖書館熱衷于建設數字圖書館。然而,圖書館購買的數字資源大多以年為期限的方式購買,如果合同終止大部分數字資源將不復存在,數字信息的長期保存也不夠充分。數字圖書館不同于傳統圖書館館藏,它依附于現代計算機技術、具有很多不同于傳統信息的特征,比如數字資源現有形式的多樣性、存儲信息的動態性、以及數字圖書館館藏資源的多樣性、訪問媒體的復雜性等等。這些特點使得我們必須盡快尋找一種適合數字資源的長期保存策略。
1 數字圖書館信息資源長期保存的問題
1.1 數字載體的安全性
隨著現代數字信息技術的發展,數字資源以前所未有的速度和規模不斷地產生。世界上每人每年產生的信息量大約為500MB,其中絕大多數的信息以多媒體的形式存在,而印刷載體的信息量僅占總數比例很低。因此,數字圖書館所涉及的數據類型不僅包括文本而且也包括很多多媒體信息。由于多媒體信息占用了大量的存儲空間,數字圖書館面臨的數據必然是海量的,到目前為止,還沒有任何系統遇到過這么大量的數據。因此,如何有效地保存和管理這些海量數據,使系統成本不高,系統響應快,是數字圖書館系統設計的重要課題。
在數字圖書館中,文獻信息都是依附于存儲介質存在。目前常用的存儲介質是只讀式光盤,一次性寫入光盤,磁盤,可擦式光盤等等。這些數字信息的壽命完全取決于其物理載體的壽命。由于載體的不同,它們的使用壽命也不同,有的只有數十年。即使總的使用壽命可以達到很長的光盤與過去一千年的紙質文獻相比,也是曇花一現。傳統的資源載體可以通過觀察其物理外觀特征來判斷其保存和使用狀態。數字資源的載體需要使用相應的設備來檢查其存儲和使用。與傳統載體相比,數字資源載體體積小、容量大,但載體容易劣化和損壞,易遭受毀滅性損失,對存儲環境要求越來越高。在大容量高密度存儲介質的情況下,存儲介質的不穩定性增加,有效壽命降低。因此,載體問題是數字資源長期保存中需要直接面對的問題之一。系統升級、技術更新、信息遷移、格式轉換等會導致信息讀取和信息失真的不穩定。計算機網絡的固有特性,如計算機病毒、網絡危害、系統泄漏、黑客等,使得數字資源面臨前所未有的安全問題。一旦數字資源被病毒侵蝕和黑客攻擊,它們可能在瞬間消失。人為因素、環境變化的保護、停電和不可抗力因素(如戰爭、閃電、火災等)會對數字資源造成不可挽回的損害。
1.2 數據遷移與重組等技術問題
技術進步導致數字資源所依賴的環境發生了重大變化,如硬件、軟件和網絡環境。如果數字資源本身不能隨著環境的變化而及時演進,那么數字資源很可能處于新的環境中失去相應的數字信息。
遷移涉及底層數據的配置變化,其文獻本身內容沒有變化。當硬件和軟件技術更新,意味著除非數據遷移到較新的機器中,否則數據不能再被訪問。遷移通常涉及一些重新修飾,這回避了數據是否仍然像遷移之前一樣傳遞相同內容信息的問題。數據結構越簡單,內容就越簡單明了。對于復雜鏈接的形式,比如網站等,很難看出如何能夠毫無損失地復原它們,除非在結構上生成復雜的文檔。
存儲和數字化信息利用的技術體系和數字環境由硬件,軟件和服務系統的限制。軟件更新和技術陳舊是其中一個主要原因。閱讀和理解需要數字信息的設備和軟件,以及設備和軟件的快速更新將使數字信息長期保存遭受技術過時的制約。與載體壽命的問題相比,更為緊迫的問題是閱讀和檢索數字資源的技術問題。數字資源的系統軟件與硬件平臺的依賴使數字資源的讀出和恢復技術成為另一個阻礙數字圖書館的發展的因素。
1.3 頂層設計統一標準
數字圖書館目前缺少全國性的、統一的協調組織機構,公共標準的缺失是數字信息長期保存困難的根本原因之一。多年來,我國數字圖書館的研究重點主要集中在數字圖書館體系結構、信息組織與檢索系統、信息顯示與可視化、智能化等方面。中國的數字信息保存一直處于實驗階段,缺乏相關和廣泛接受的標準。標準是緩解技術更新與數字信息閱讀矛盾的良好途徑,但很多行業標準嚴重滯后于發展需求。制定標準應廣泛征求相關技術人員和管理人員的意見。不應該閉門工作或者只是聽取少數人的意見,導致指導和規范每個行為的標準嚴重落后于國際發展水平。在實際工作中也大量存在標準兼容性和選擇問題。不同的保存技術具有各自的優缺點,都符合各自的標準規范,但兩者如何統一運行是目前比較難解決的問題。作為要保存的數字信息,應以最穩定的技術和通用標準進行歸檔,并與相關行業標準和國際標準相兼容,這是我們首先要考慮的重要問題。
2 數字圖書館信息資源長期保存的策略
針對數字圖書館信息資源長期保存目前存在的問題,本文提出數字圖書館信息資源長期保存的對策和方法,從構建體系入手,多方面應對,從而建立綜合治理的完整應對措施。
2.1 制定合理統一的政策
保護政策是數字資源長期有效保護的有效保障。這些政策包括技術、組織、人文、法律和權益管理。我們要加強國際和國內合作,可以參照聯合國教科文組織發布的《數字遺產保護憲章》等法律法規來進行制定政策。
在數字資源長期保存中,宏觀的規劃、組織與控制是數字資源長期保存的基礎和保證。數字信息資源是國家信息資源體系的重要組成部分,是建設網絡化社會和知識社會的基礎設施。因此,數字資源必須作為國家綜合規劃和研究的基本戰略加以保護。把數字資源保護政策提高到國家水平,有利于各種資源的合理配置,從宏觀上保證數字資源保護計劃的有效實施。需要動員國家各方面的力量,取得政府部門在政策和法規上的支持,得到信息產業領域的幫助和科研機構的指導,還要充分與軟件商、供應商等合作,才能使我國的數字圖書館信息資源的建設產生良好的預期效果。
在傳統的圖書館中,文獻的所有權和保存權是統一的,傳統媒體的穩定性保證了館藏的長期保存。數字資源創造者和出版商經常使用數字保護和其他保護措施來分發數字產品以保護版權。國家應該建成統一的數字資源的保存基地,要求數字資源出版商必須提供數字資源產品的樣本,保證國家控制下的數字資源長期保存。規范和審查出版商的數字資源也是重要環節之一,采取全體協作戰略能夠充分提高效率,并且避免由于規范或者標準不統一所造成的數字資源損失。
2.2 國家持續資金支持
數字資源的保存和保護需要大量的資金支持。數字資源保存的成本可以分為兩部分。第一部分包括人力資源、軟硬件支持、保存環境的維護和日常管理;第二部分主要包括數字遷移的成本。前者的成本較容易計算,而后者具有很大的不確定性。由于國內數字圖書館資金來源渠道主要是政府部門,在數字資源保護規劃時,必須充分考慮可持續發展問題,盡可能的增加資金來源渠道。如果沒有一個可持續的資金來源支持,數字資源的保存將無法得到有效實施。
2.3 選擇專業的保護機構
國外具有專業機構從事數字資源保存,承接專門領域或特殊形式的項目。主要出版商的數字資源大多委托荷蘭國家圖書館數字檔案系統長期保存。英國國家圖書館特定部門負責保存聲音文件。從技術上講,現有的數字遷移、技術保存等都有其特定的要求和條件,不同的數字資源具有不同的技術保存要求。我們必須充分考慮和估計這些因素,設立專業機構來從事保護特定的數字資源,這些結構可以承擔政府項目,從科學研究的角度來保存特定的數字資源。
3 結束語
通過多種形式保存文獻遺產對文明社會都具有重要意義。鑒于其重要性,以及需要長期建立和預測許多戰略因素和成本,這是一個存在許多不確定性的領域。這涉及廣泛的問題,不僅包括制度、設備、方法、技術等,還包括各國的經濟、文化、法律等等。不同的應對策略有擁護者也有反對者,所以必須利用國家機制的力量,使數字資源的長期保存能夠繼續有效地存在。我國數字資源的長期保存尚處于起步階段,在發展過程中還存在許多問題需要進一步研究。為了避免各科研院所的分立管理和重復,以及無法達到制約和值得信賴的狀況,國家必須有效地指導和協調全國各主要科研和教育機構,科學分工、持續投入、安全備份、形成可持續發展。
(作者單位:吉林省社會科學院)