謝永憲
信息時代,數字信息資源已經成為戰略資源。數字信息資源在海量產生的同時也在大量丟失,世界各國都在積極應對,開展數字信息長期保存項目,探索數字信息保存的規律。但是由于數字信息長期保存技術發展快,標準不統一,嚴重影響數字信息的交流和互換。這時,OAIS參考模型應需而生。OAIS參考模型為數字信息長期保存項目提供了一個容易接受的應用基礎框架,它作為數字信息長期保存的基準框架,已經被各國相關研究機構與保存部門廣泛認可,并應用到很多數字信息保存項目中。聯網的歐洲圖書館保存項目NEDLIB認為,OAIS參考模型適合于任何類型的檔案館,尤其適合于那些負責信息長期保存與利用的組織。
我國在進行數字信息長期保存相關項目的開發時,有必要采用OAIS作為基礎框架模型,這樣我國數字信息長期保存工作既能利用國際最新研究成果,跟上國際數字信息長期保存工作發展的步伐,又能實現數字信息長期保存系統與國際同行接軌,保證數字信息長期保存工作的資源共享和信息交換。然而,數字信息長期保存是龐大復雜的工程,沒有統一的建設模式;同時也是技術含量高、資本投入高的項目,建設風險很大。這就有必要學習國際上的成功經驗,在利用OAIS參考模型開展保存項目時做好相關準備,規避各種風險,少走或者不走彎路,確保項目
順利完成。
一、OAIS參考模型
OAIS參考模型是美國國家航空和航天局(NASA)和太空數據系統咨詢委員會(CCSDS)聯合制定的一項標準。2003年,參考模型最終成為ISO標準并頒發。OAIS參考模型本身并不是專門的用來解決數字信息長期保存的特殊技術,而是著重論述了與數字信息保存相關的各種關系和框架概念,以及應對數字信息保存處理過程的策略。OAIS參考模型是一個廣泛的模型,涉及并論述了從數字信息存檔設計到開放式存儲整個過程中的相關問題。它由六個功能模塊組成。①攝入:從信息生產者那里接收提交信息包,并且對內容進行準備,然后傳遞給長期存儲模塊;②長期存儲:負責存儲、維護信息包,并在獲取功能模塊提出請求時將提交信息包提供給該模塊;③數據管理:植入、維護和存取那些標識并記錄檔案館藏的描述信息以及對存儲系統進行檢索與管理;④系統管理:通過有關政策、規范、程序、工作流等來監測和控制整個長期保存系統的運行和各個模塊的運行,對整體的檔案系統提供操縱管理;⑤保存規劃:監測OAIS的環境,提供相關建議以確保在OAIS中存儲的信息在一段時間之后,仍然能夠被相應的目標用戶所訪問;⑥存取:提供用戶檢索元數據和索取數字信息單元的界面,提供檢索機制,存取存儲在OAIS中的信息,還可能承擔身份認證和授權管理責任等。
二、OAIS參考模型的實踐應用
1、永久保護電子文件真實性國際研究項目(Inter PARES)
1999年加拿大發起成立了永久保護電子文件真實性國際研究項目,項目由包括加拿大、美國、英國、荷蘭、中國、韓國等十余個國家的檔案館以及一些大學和研究機構共同參與研究。其主要目標是建立一整套的理論和方法用于切實保障在數字形態中創建或維護的可信的文件,確保電子文件及其真實性的永久保存。Inter PARES項目根據研究目標的需要,對OAIS的六個功能模型進行了取舍,保留了攝入、存儲、數據管理、系統管理、保存規劃功能,同時放棄了OAIS中規定的一些功能,比如通知潛在用戶需要對文件進行保存、什么情況下對文件進行訪問等。
2、美國電子文件檔案館項目(ERA)
2005年8月,美國國家檔案館開始了致力于解決政府數字信息長期保存的電子文件檔案館計劃,該計劃將耗資3.08億美元、開發時間長達6年。ERA的目標主要是通過保存任何形式的電子記錄,以提供給現在及未來的使用者存取。對ERA而言,OAIS模型為其實體、功能、數據流和管理行為提供了一個整體上的框架。在系統內部,OAIS為ERA定了三個虛擬工作區:存取工作區、存儲工作區和查詢工作區,三個子系統采用相同的信息技術來架構,在ERA內互相支持,共享數據。
3、歐盟NEDLIB的電子出版物保存系統(DSEP)
1998年,歐洲國家圖書館聯合會常設委員會發起了NEDLIB項目,歐洲8個國家圖書館、一個國家檔案館和三個出版商參與了這個項目。項目的目標是構建一個基于網絡的歐洲保存圖書館的基礎框架,與各個國家的國家保存圖書館任務相適應,確保在目前可用的電子出版物在將來同樣可供利用。該項目的電子出版物保存原型系統,在OAIS基礎上加了一個保存模塊,該模塊保證了所有存儲數據系統在原有各應用系統出現故障的前提下系統仍可使用。通過增加這個分離保存實體模塊,使保存網絡電子出版物的過程可視化和更精確。
國外著名的對OAIS的應用研究還包括澳大利亞的維多利亞電子檔案保存項目、英國的Cedars分布式數字存檔原型系統以及美國加利福尼亞大學的數字保存倉儲系統等等。
三、幾點啟示
1、根據需要對模型進行靈活運用
OAIS只是參考模型,而不是系統設計模型,在保存系統設計過程中需要根據不同保存需求進行系統的分解和設計。如,Inter PARES項目放棄了OAIS中規定的一些功能;而NEDLIB的電子出版物保存系統在OAIS基礎上加了一個保存模塊。
2、優化技術保障策略
OAIS參考模型是對數字信息長期保存系統的外部環境、功能模塊及保管對象的概念化,并非具體實施方案,在利用OAIS進行系統設計的過程中會涉及很多技術問題,如系統結構、存儲技術、檔案系統功能需求等等。目前,實現的途徑有:一是數字信息保存機構與實力較強的技術企業合作,進行系統設計,比如美國國家檔案館在ERA項目中與洛克希德·馬丁計算機公司合作、荷蘭國家圖書館和IBM共同開發e-Depot項目等。二是技術實力強的數字信息保存機構自行設計基于OAIS的保存系統,比如佛羅里達圖書館自動化中心的“黑色檔案系統”、加利福尼亞大學的數字保存倉儲等。三是引導企業為滿足市場上對OAIS利用的需要而開發技術,比如IBM、EMC、HP、SUN等企業,或獨立或聯合,開發出了智能數據存儲(IDS)、數字信息存儲系統(DIAS)等技術。
3、開展廣泛的合作與交流
數字信息長期保存項目利用OAIS進行系統設計時,涉及技術、標準、法律等眾多研究方向,項目的完成需要來自不同機構的合作和共同努力。目前,可以借鑒的合作方式有:一是國家間的合作,如DELOS項目成員來自13個國家;二是不同數字信息長期保存研究機構之間的合作,如NEDLIB項目由8個國家的圖書館、一個國家檔案館和三個出版商共同完成;三是不同行業之間的合作,如荷蘭國家圖書館和IBM在e-Depot項目中的合作等。通過不同方式的合作,有利于實現技術的合作攻關、資源的合理分工、經費的最佳分配,保證數字信息長期保存機構完成既定目標。
4、確保必要的資金支持
數字信息保存機構利用OAIS開展長期保存項目,在研發技術、購買設備、人員培訓、系統維護等方面都需要進行大量的資金投入。數字信息保存機構很難獨立解決資金問題,需要外界資助。美國的ERA項目計劃投資3.08億美元、歐洲委員會電信應用項目資助了NEDLIB項目。我國數字保存機構在開展數字信息長期保存項目時可以向各級主管部門和政府機構申請資助,以保證項目的順利進行。
5、重視人力資源建設
在利用OAIS進行系統設計過程中,數字信息保存人員要將自己的需求向技術專家進行表達;系統設計完成后,數字信息保存人員需要掌握相關操作的專業技巧。這就要求數字信息保存相關人員即具備信息保存方面的專業知識又具備計算機方面的知識。Inter PARES項目第三階段的部分任務就是探索如何對相關人員進行培訓。我國可以采取多種方式培養符合時代需要的高素質數字信息保存人員,比如正規教育,即在設置信息資源管理及相關學科的高校教育中增加信息技術等課程;繼續教育,以在職學習和短期培訓為主,同時輔以學術講座、專題研討等多種形式。
參考文獻:
①宛玲:《國外數字信息長期保存的最新發展及對我國的啟示》,《中國圖書館學報》,2004年第2期。
②任平:《歐洲數字信息長期保存研究及其啟示》,《大學圖書館學報》,2005年第4期。
③吳江華:《開放性檔案信息系統:背景、職責及功能》,《圖書·情報·知識》,2006年第9期。
④Inter PARES,Preservation Task Force Report[R],http://www.interpares.org/book/interpares_book_f_part3.pdf
作者單位:中國人民大學信息資源管理學院