摘要:數字信息長期保存是伴隨信息數字化、服務網絡化的發展而出現的新事物。由于數字檔案信息對存儲媒體的依賴性、數字檔案信息的動態性、技術更新周期的短暫性、數字檔案信息的不安全性及數字信息對標準的依賴性,都使得數字檔案信息的長期保存與維護遇到了前所未有的問題。文章根據國內外數字檔案信息的長期保存研究,針對當前數字檔案信息長期保存所面臨的主要問題,研究數字檔案信息長期保存的方式和方法,旨在為檔案部門進行數字檔案信息的長期保存工作提供借鑒。
關鍵詞:數字檔案 數字信息 長期保存 技術應用 管理策略
中圖分類號:G 271 文獻標識碼:A 文章編號:1671-623X(2011)O1-0078-05
數字檔案信息是以數字形式記載、存儲、管理和利用的檔案信息,它既可以是新歸檔的數字形式的檔案,如電子文件、211工程圖紙、多媒體數字攝錄像信息,也可以是現有館藏的紙質檔案經過數字化加工后形成的聲音、圖像、圖片等電子信息,同時又可以是檔案管理部門在工作過程中形成的方便檢索、方便查詢、方便統計的檔案目錄信息。數字信息長期保存是伴隨信息數字化、服務網絡化的發展而出現的新事物。它可以確保人們長期、方便、安全、可靠地獲取及利用數字信息。數字信息的出現給檔案工作提出了新的要求。由于數字檔案信息對存儲媒體的依賴性、數字檔案信息的動態性、技術更新周期的短暫性、數字檔案信息的不安全性及數字信息對標準的依賴性,都使得數字檔案信息的長期保存與維護遇到了前所未有的問題。因此,檔案部門要關注數字信息資源的長期保存,加緊構建信息資源保護和歸檔體系。
一、數字檔案信息資源的長期保存問題
1 國外數字檔案長期保存的方式和方法
國外數字檔案長期保存的研究主要經歷了技術階段、技術和管理階段(模型和策略階段)。美國是信息技術最發達的國家,上世紀70~90年代間,在數字信息長期保存上主要采用遷移、仿真、數據再造等技術。由于技術的局限性,人們開始關注從管理和技術相結合的辦法來解決數字檔案長期保存的問題。比較典型的是于1999年由美國國家航空和航天局NASA和美國太空數據系統咨詢CCSDS聯合制定的OAIS(OPEN Archival Information System)標準,旨在對資源的存取和長期保存規定概念和參考框架。2003年OAIS正式成為國際標準ISO:14721。國外一些典型的政府信息長期保存項目值得借鑒,它們從技術和管理策略等方面,實踐了政府信息的長期保存,如英國政府信息存檔NDAD(The National Digtal Archives of Datasets)項目。NDAD項目所保存的信息可追溯到1963年,其成功經驗值得我們檔案界學習。
另外,美國研究圖書館組織(RLG)于1996年發表的“保存數字信息”報告指出:“數字化歸檔基礎建設的一個必不可少的組成部分就是構建相當數量的可信組織(Trusted Organizations)”。報告強調,在數字資源的長期保存、有效管理過程中,可信數字倉儲(Trusted Digtal Repository,TDR)能夠發揮關鍵作用。
2 國內數字檔案長期保存的方式和方法
我國數字檔案館建設起步較晚,于上個世紀90年代后期開始研究數字檔案館的構建,但發展速度較快,至今為止已經有許多經濟發達地區開始構建數字檔案館,并逐步進入高潮。在數字檔案館建設過程中,不斷地研究和探索數字檔案長期保存的方式和方法,如借鑒OAIS模型構建數字檔案館項目已進入實施階段、也制訂了參考OAIS模型的《電子文件元數據標準》草案。
我國的部分高校檔案館也在積極從事數字信息長期保存的研究和實踐。2006年,啟動上海師范大學館藏檔案數字化工程,它是上海市檔案局檔案數字化工作的試點,用三個月的時間對該校教學檔案中的學生成績檔案、文書檔案中的永久卷以及基建檔案中的關鍵圖紙進行數字化。檔案信息化是必然趨勢,推進檔案信息化建設是檔案工作發展的一個重要戰略。館藏檔案進行數字化,實現檔案信息資源社會共享的一項重要舉措,既能更好地保護紙質檔案原件,同時也是檔案管理模式改革的一個新嘗試。2009年上海第-'SE業大學檔案數字化加工項目啟動,主要是對該校庫藏二工大全宗的教學檔案(包括學生成績大表和學生學籍卡片和新生錄取名冊三大類)進行整理、掃描、條目著錄、圖像處理、添加水印、數據掛接、光盤刻錄等數字化處理。
二、數字檔案信息長期保存面臨的問題
1 數字檔案信息載體的壽命問題
數字檔案信息是存儲在一定的物理載體上,如各種不同類型的磁盤光盤等。其壽命就取決于這些物理載體的壽命。與傳統載體相比,數字檔案載體的體積小、容量大,對存儲環境的要求高,容易發生變質、損壞,遭受毀滅性損毀。再者,由于數字檔案載體需要借助相應的設備,才能判斷其物理表象特征和其保存與使用狀態,因此,對于數字化檔案載體的保存和使用狀況很難及時掌控。當今的數字存儲介質至多只能維持幾十年,目前存儲技術的快速發展,使得大容量高密度存儲介質不斷推出,但存儲介質的不穩定性增大,其有效壽命也在不斷下降。
2 數字檔案信息所依賴的計算機軟件技術過時問題
數字信息長期保存技術的穩定和成熟只是相對的,造成數字信息長期保存最大的威脅是技術過時。數字信息從形成、傳輸到存儲都是通過計算機實現的,人們在檢索和閱讀數字化檔案時,必須依賴特定的硬件設備、操作系統和應用軟件對數字化檔案的內容加以轉換,還原成人們能夠直觀理解與習慣閱讀的格式進行顯示。但是計算機硬件設備的迅速發展(如磁盤或磁帶的驅動器)和操作系統的更新換代給信息處理、信息存儲、信息傳輸和信息閱讀帶來極大便利的同時,也會造成軟、硬件易于過時作廢。數字檔案信息對系統軟硬件平臺的依賴性,使得數字化檔案的讀出、還原技術過時問題成為困擾數字化檔案長期保存的又一大障礙。技術環境的變化要求數字信息保存技術相應地變化,數字保存系統所采用的硬件技術應能保證其提供的存取服務符合用戶的要求。隨著技術的發展,用戶對數據的存取量越來越大,數字保存系統就必須增加網絡帶寬來滿足不斷增長的數據訪問量要求。
3 數字檔案信息真實性的問題
數字檔案的真實性包含了文件與其用意相符、文件的形成和發送與其既定的形成者和發送者相吻合以及三層含義。因此,數字檔案的真實性還應包括與它所代表的原件相一致(或記載不同之處)。數字檔案信息長期保存應極力維護數字化檔案的真實性。然而由于數字化檔案具有易更改性,在保存和使用的過程中,容易被人為修改、拷貝、移動、粘貼和重新編輯等,且改動不留任何痕跡,造成數字化檔案的真實性難以確認。同時,數字化檔案的結構具有復雜性,在對數字化檔案進行有效的存儲、壓縮、傳遞、遷移等過程中,容易造成數據的丟失。這些都對維護數字化檔案的真實性造成了很大的困難。隨著計算機技術的發展,人們為了追求使用信息的方便性、直觀性與可視效果,往往采用多種格式和技術來產生數字對象。目前,文字與圖形、聲音、影像等多種媒體信息能夠完美組合在一起構成數字信息的內容,數字文獻的信息形態更具多樣化和復雜化。由于信息與載體具有分離性,當載體處于聯機狀態時也許不會出現問題,如果這些載體都是脫機保存,則有可能造成混亂,處理不當會直接影響到數字信息的完整。
4 數字檔案信息存取的安全問題
傳統館藏的保存工作與其他機構的關聯不大,例如圖書館與出版社在傳統文獻的保存上并不存在緊密的關系,其中最為關鍵的是數字資源的創建人(如出版商等),他們決定著文件用什么格式產生,以什么媒體存儲,是否執行標準等,這直接關系到大量的文檔可否為其他人所管理。另一個關鍵的因素是對數字資源承擔保存職責的部門,他們必須與數字資源的創建者、提供存取途徑的部門保持不斷的對話,使三者的要求協調到有利于數字信息的長期存取上,這些造就了管理數字資源的多方合作態勢。為此,數字資源的保存與獲取,必須使『-一些與數字資源相關的部門聯合起來,充分發揮各自的優勢與技能,共同采取科學的管理方法與技術手段,保證已產生的并需要長久保存的數字信息的可獲取性。如果沒有強有力的合作管理策略,數字資源的保存與獲取會陷入風險之中。由于計算機網絡系統的脆弱性,那些保存數字化檔案的計算機網絡容易感染病毒和遭受黑客的入侵。此外,存放數字化檔案的媒體介質也可能在計算機讀寫的過程中感染病毒。數字化檔案一旦遭受病毒侵蝕和黑客破壞,將可能在瞬間化為烏有,信息難以恢復,這使得數字檔案信息面臨著前所未有的安全問題。
5 數字檔案信息技術轉換中的法律問題
數字檔案信息保存中,有許多方面涉及版權與知識產權問題。數字檔案信息隨技術更新而進行遷移、仿真等技術處理過程中,不僅涉及信息內容而且涉及相關軟件。在知識產權上,數字檔案信息比傳統檔案信息的爭論更復雜。如果考慮不周,這些問題將會阻礙數字檔案信息長期獲取行動的開展。數字檔案信息是其創建者、基金部門共同努力與資金投入的產物,他們對數字檔案信息的長期存取都應關注,為了保證資金投入與該資源對后代的智力與文化價值,情報所與檔案館應通過多種渠道解決技術轉換中的法律障礙問題。
三、數字檔案信息長期存取的策略
1 數字檔案信息存取的選擇策略
對檔案部門來說,選擇數字檔案信息的存儲載體時,數據傳送速度、存取速度不是首要因素,主要應考慮以下問題:首先,數據的不可更改性。數字化檔案必須具備檔案的屬性,因此存儲的數據必須真實、完整。可追加數據的介質和可擦除介質,存在允許非法增加數據的不安全因素,難以從法律上證明或從技術上鑒定數據是否被更改,因而不可選用。其次,載體的安全性高。數字化檔案存儲載體的選擇要更注重載體的耐久性,有效壽命短暫的存儲介質不可使用。對外界環境敏感的介質,很容易受存儲環境、外力等因素影響而丟失數據,也不選用。最后,載體的技術壽命。存儲介質的技術壽命是指與介質相關的技術存在的時間長短。技術壽命短暫的存儲介質,其技術過時后數據可能無法讀出。因而,技術壽命越短的存儲介質,數據遷移的頻度越高,數據丟失的風險也越大。數字化檔案的存儲介質應選擇具有穩定市場支持、達到相關工業標準的存儲介質。
2 數字檔案信息長期保存的技術策略第一是更新策略。更新即實現存儲介質的復制,在原來的技術環境下實時重寫數據,將數據流從舊存儲介質轉移到新存儲介質上,防止由于存儲介質理化性能變化而引起的信息丟失。該技術是一項常規的管理工作,只能解決存儲介質損壞所帶來的問題,并不能解決數字信息的可用性、完整性和真實性等問題。
第二是轉換策略。廣義的轉換不僅指格式的轉換,還包括程序的轉換、字符編碼的轉換、媒體的轉換、操作系統的轉換、硬件系統的轉換等。其目的是在紙張、縮微膠片、磁性材料等介質并存的混合環境中,實現不同介質之間信息內容的保存。該技術的不足是:成本高,工作量大,轉換有可能使數字信息在結構、內容等方面出現丟失現象,從而使用戶對數字信息的可靠性產生質疑。
第三是遷移策略。遷移是指數據格式、結構或標準的轉換。它是數字信息長期保存中的主要技術手段。從計算機發展趨勢來看,無論你將當前的數字信息維護得多么好,只要數字信息的可獲得性與可用性出現問題,最終它都將遷移到能夠滿足可獲得性和可用性要求的不同的媒體或不同的硬件(或軟件)環境去。在數字信息的長期保存過程中,促成數據遷移的主要因素有硬件設備更新換代,數字信息的存儲格式標準過時作廢,以及用戶需求的變化(如應用程序的升級、改版)等都將形成數據的遷移。有效的遷移必須保證數字信息的真實性、完整性、可用性和可理解性,否則遷移將造成信息的嚴重丟失。
第四是技術典藏。技術典藏是指收集技術過時的計算機軟硬件和相關設備,利用它來讀取已經過時的技術設備存儲的信息。其涉及典藏的內容包括原始應用程序、操作系統軟件以及硬件平臺,強調應保存數字信息的原始運作環境,才能呈現數字信息的真實面貌,從而實現數字信息的長期保存。
3 數字檔案信息的長期保存管理策略
為了保證有價值數字信息的長期存取,并讓用戶相信所使用的數字信息是完整、真實的,必須要建立數字信息歸檔系統,來保證數字信息的長期運行。國外專家“數字信息歸檔唯一有效與可行的策略是建立分布式檔案館進行管理。”建立在電子網絡基礎上的分布式電子歸檔系統能承擔對某一數字信息的價值的最大了解,以便正確地決定選擇;同時也能仔細地履行它們的歸檔責任,靈活地響應技術轉變的時機,以促進數字信息長期存取和保護。為了便于用戶對數字信息的存取,入藏的數字信息對象的存貯可考慮建立多個存貯級別。為了防止數字信息的丟失,在存貯過程中應為歸檔的數字信息對象制作多個備份。現今,美國已組建了許多這類數字信息的歸檔系統,比如,人口調查數字檔案館、遙感衛星圖像數據或商業數據檔案館。我們也應當尋找能保證數字檔案館長期運行的數字信息歸檔系統的模式。
4 數字檔案信息長期保存的安全策略
由于數字信息的長期保存涉及法律、經濟、文化、技術、社會道德諸多方面。因此,數字信息的長期保存需要多方面、多形式的合作與支持,單憑傳統的圖書館、檔案館等來進行長期保存是難以勝任的。確保數字檔案信息安全的管理制度,應在數字檔案信息的形成、積累、保管和利用等各個環節上制定管理制度,設立責任人,明確責任人的職責。如果一個環節的職責不明確,管理制度不嚴密,就可能造成數字檔案信息失真或丟失。目前我國的檔案管理部門,對信息安全管理制度的制定處于各自獨立、各行其職的狀態,不同領域、不同部門的安全管理制度也不盡相同,國家缺乏一個系統、完善的管理制度作為基礎。“美國制度經濟學先驅之一凡勃侖認為,‘制度必須隨著環境刺激的變化而變化,因為就其性質而言,它就是對這類環境引起的刺激反應的一種習慣方式。而這種制度的發展也就是社會的發展……’檔案信息服務方式和手段的變革,必須要建立與之相適應的機制和制度,否則,數字檔案信息的安全是不可能得到保障的。”
5 數字檔案信息長期存取的標準策略
國家檔案局要聯合相關職能管理部門共同頒布信息管理系統的功能需求標準,對保證數字記錄真實性、完整性與有效性的需求指標提出強制性要求,確保數字記錄的憑證價值與管理價值,以及長期可讀的可能性。同時,以法規的方式要求法人單位對信息管理系統的設計必須提供本機構的功能需求信息,避免國家在信息化建設上投入與產出的不平衡。
“目前,我國檔案信息安全立法層次分為國家法律、行政法規、地方性法規、規章和規范性文件五個層次。檔案信息安全保障法規體系框架按不同的標準,可由不同的部分構成。如按檔案信息流程,即信息的收集、整理、保管和利用等過程,可將檔案信息安全法規范為檔案信息收集、整理、保管和利用等方面;按檔案信息安全法規調整的宏觀、中觀和微觀對象的不同層次,則檔案信息安全法規體系可分為檔案信息安全基本法規,專門法規和部門法規等;檔案信息安全法規規范依據檔案信息安全法律關系主體和權利特征也可分為檔案信息公開法規、檔案信息保密法規、商業機構檔案信息安全法規、政府機構檔案信息安全法規、檔案信息產權法規等。”我國已頒布的有利于維護數字檔案信息安全的法律法規,一方面有利于協調和解決各種矛盾,保障檔案信息的安全,另一方面可以更好地維護國家利益和社會公共利益、推動檔案事業協調、健康、可持續發展。
四、結語
綜上所述,數字信息長期保存是一項十分艱巨和復雜的工作。數字檔案正在逐漸成為社會檔案信息資源的重要組成部分,實現數字檔案信息的安全管理,有利于維護數字檔案的憑證價值,提高數字檔案信息資源的長久存儲,更有利于檔案館向利用者提供更好的服務。隨著檔案信息化建設、數字檔案館、電子政務的不斷推進,檔案館越來越多的產生和接觸到數字信息資源,實施數字信息資源網絡化歸檔,不僅能夠滿足用戶了解當前社會現狀、研究當前社會發展歷史經驗的需求,而且還能起到傳承民族與人類文化的作用。國外很多國家在這方面的研究和應用已經取得長足進步,并在實踐的過程中積累了很多知識和經驗。因此,檔案部門應當積極的面對各種問題,借鑒國內外的先進經驗,為將來的國家數字信息長期保存奠定堅實的基礎。
參考文獻
[1]施敏,項文新,數字檔案信息長期保存方式和方法研究[J].辦公自動化,2009(3):10-12
[2]劉家真,許杰,影響我國數字信息長期保存的問題與解決方案[J].檔案學研究,2008(4):54-55
[3]劉家真,維護數字信息長期存取的管理策略[J].中國圖書館學報,1999(5):56-58
[4]樊如夏,鄭志榮,影響數字檔案信息安全的因素與對策[J].檔案學通訊,2007(6):74
[5]陳慰湧,秦建偉,數字信息長期保存研究現狀分析[J].浙江檔案,2008(1):43-45
[6]宗文萍,初探新時期檔案信息安全的法制保障[J].法制建設,2007(4):55