袁紅梅
1、數字資源長期保存的必要性
數字資源長期保存的目的是要保證未來用戶可以檢索、獲取、瀏覽、理解各種數據和記錄,它是一項長期的需要大量投資等工程。從數據的組織形式上看,數字資源有數據庫、電子期刊、電子圖書、網頁、多媒體資料等類型。按存儲介質可分為磁介質和光介質兩種類型。其中,磁介質包括軟盤、硬盤、磁盤陣列、活動硬盤、優盤、磁帶等類型;光介質包括CD、DVD、LD 等類型。常用的數字資源存儲介質為硬盤、磁盤陣列、磁帶及CD、DVD、LD 等。
由于數字資源尤其是網頁內容的資源,更新速度非常快,許多資源稍縱即逝,如果不注重保存,很可能就無法再找到信息資源的內容。面對如此龐大數量的網絡資源,數字資源長期保存越來越成為了一個亟待解決的問題,否則重要的文化遺產將會迅速消失。
2、數字資源長期保存的技術方法
2.1遷移技術
美國保護與存取委員會(CPA)所屬的數字信息歸檔特別工作組曾在報告中指出:“遷移是對付技術過時的最佳良策,它應是數字資料完成定期轉換的一系列有組織的工作,包括維護數字對象的真實性、用戶的再檢索、顯示與其它利用的能力”。還有的國家的研究部門認為,數字信息長期存取問題可以歸結為:遷移、媒體材料和管理。西方發達國家數字檔案館大量的成功實踐表明,遷移是維護數字信息長期存取的有效方法。遷移的策略主要有兩種:一是將數字信息從穩定性低的媒體上遷移到穩定性高的媒體上,從對軟件依賴強的格式遷移到對軟件依賴程度低的格式上;二是把數字信息從各種不同格式遷移至易于管理的最簡單且符合標準的格式。
2.2更新技術
美國國家檔案文件管理局(NARA)就指出,CD- ROM、WORM 和可擦式光盤等三種光學媒體可以用來作為數字文件的載體。我國國家檔案局在《辦公自動化電子文件歸檔與電子檔案管理方法》中規定,電子文件應“ 拷貝至耐久的載體”,禁止用磁盤來保管電子文件,并分先后次序對載體進行了推薦只讀式光盤、一次寫入光盤、可擦式光盤、磁帶。為了防止媒體質量的惡化而使數字信息不可存取,人們正在使用更新技術不斷地通過復制將舊存儲媒體上的數字信息轉移到新的媒體上。
2.3轉換技術
轉換是指把信息從一種媒體轉移到另一種媒體上,包括格式變換與復制。轉換的目的是在紙張、縮微膠片、錄像、磁性材料、光盤等媒體并存的混合環境中實現不同媒體之間信息內容的保存。轉換的內容很多,比如:對已有軟件進行修改,使之在不同環境下工作時具有相似的功能,如把在某一臺計算機上運行的程序變換成能在另一臺計算機上運行的程序;將一種文件格式轉換到另一種文件格式,或從一種字符編碼方式轉換到另一種字符編碼方式;將一種媒體轉換到另一種媒體上;從一種操作系統轉換到另一種操作系統上;改變系統的硬件使其工作于新的或不同的設備,以對系統進行升級等。
2.4仿真技術
仿真是通過詳細描述數字信息利用的各種技術參數和環境條件,使未來計算機系統可以模仿原始系統環境來讀取和使用數字信息內容。
仿真技術適合于超文本、多媒體等復雜的以及其它依賴特別軟/硬件而又無法在新、舊技術平臺之間進行遷移的數字信息。但是,仿真技術是在保存數字信息的同時,通過保存數字信息利用的軟/硬件環境來保障對數字信息的可利用性。而在技術更新周期不斷縮短的現實環境之中,努力來開發一個執行過時的軟/硬件的系統。
2.5數字圖形輸入板技術
數字圖形輸入板是為了克服遷移技術存在的遷移時機不易把握、無法保存復雜數字信息的缺點而開發的一種新的技術。數字圖形輸入板技術有許多優點,比如:第一,數字圖形輸入板融信息存儲與處理功能為一體,可以對數字信息進行動態保存。第二,數字圖形輸入板具備觸摸和聲控功能。第三,以光為能源或自帶電源,自備屏幕并將屏幕上的信息自動轉化為數字信息儲藏。第四,數字圖形輸入板具有堅固的實體,防水、抗重力、耐寒、耐高溫。第五,儲存能力達數百上千TB字節。數字圖形輸入板適用于年度報告、政府法律文獻、珍貴藝術品的保存,而對于一些用途有限、需要定期刪除的信息則宜選用遷移策略。序
2.6再生性保護技術
再生性保護技術是將過時的某些數字信息適時地轉換到縮微品或紙介質上的一種保護措施。一般認為,轉移到縮微品上會更可靠一些,因為縮微膠片的理論壽命達五百年之久,而國內外用縮微膠片保存信息也已經有了數十年的豐富經驗。再生性保護技術存在的問題是:部分有聲信息、多媒體信息無法轉移到膠片或紙張上去;信息如果轉移到膠片或紙張上之后,由于這兩種載體表現形式的局限性,會使數字信息失去原有的風格和魅力。
3、國內數字資源長期保存現狀
3.1 WICP 項目
WICP 項目分網站單元和網頁單元進行網絡文獻的收集、編目和保存,分別形成鏡像存檔和專題存檔。專業多為英語、計算機、圖書館學、情報學專業,通過對信息單元(即收集、編目和保存網絡文獻的最小單位,一個信息單元在存檔系統對應一個標識符)進行收集。該項目積極探索信息資源的采集與保存的相關法律、技術、標準等問題,在進行網絡信息的采集和保存時,對靜態網頁(表層網頁)和動態網頁(深層網頁)采取不同的策略,形成對應的兩個子項目,即網絡信息資源采集與保存試驗項目(WICP)和網絡數據庫導航項目ODBN(Online Database Navigation)。
國家圖書館開展保存試驗項目的目的是通過試驗發現網絡文獻收集、整理、編目、保存和服務中存在的問題,提出解決問題的方案;確定保存對象,根據其特點確定技術路線和策略;試驗性收集、整理、保存數據并提供服務;提出業務整合的方案。它不僅為我國網絡信息資源保存實踐開辟了新路,也為今后的保存實踐提供了寶貴的經驗。
3.2 Web信息博物館
中國Web信息博物館(Web Information)是2002年1月,在國家“973” 和“985”項目支持下,由北京大學“計算機網絡與分布式系統實驗室”主持開發的中國網頁歷史信息存儲與展示系統,包括歷史網頁存儲系統和回放系統兩個部分。目前系統可以收集中國所有靜態網頁,并提供歷史網頁的存盤和回放,已經維護有30億以中文為主的網頁,并以平均每4500萬網頁的速度擴大規模。其基本使命是以一種集中的形式,全面展現中國互聯網上信息的歷史;為社會提供多種海量網絡信息產品,供相關科研人員進行研究。數字長期保存是一個需要持續投資的昂貴項目,缺乏國家層面上數字保存政策的支持,會導致保存質量難以得到保障,各個保存項目之間難以實現數據交換和資源共享,使得經費本來就異常困難的圖書館雪上加霜,背上沉重的經濟負擔。因此,在數字資源的長期保存活動中,制定國家層面上的保存策略,實行各保存機構的有效協作,是降低保存成本的途徑之一。