王小玲
摘 要:電子文件是我國信息資源的重要組成部分,其長期保存對于發揮信息資源綜合貢獻力具有重要作用。針對電子文件長期保存過程中出現的問題,筆者提出遷移、仿真、開放描述與標準化等電子文件長期保存技術策略。
關鍵詞:電子文件;長期保存;技術策略
1 前言
電子文件長期保存是電子文件進入檔案管理階段后的主要管理目的,保存期限由法定需要和業務需要而決定,對于檔案館這樣保存公共文件的機構,保存電子文件的期限通常為幾百年。所謂長期的概念,是指時間足夠長以致于需要關注技術變化的影響,包括新介質及數據格式的支持,或者用戶群的改變。
錢毅認為電子文件的長期保存,可視為降低數字對象對軟硬件環境的依賴性的過程。電子文件的長期保存包含比特保存和信息保存。比特保存主要指存儲載體老化或逐步過時的過程中,或在經歷不可控自然災害后,恢復存儲載體上所存信息的能力,重在解決硬件存儲問題。信息保存指在技術革新和用戶群變化情況下,電子文件數據可讀性與可用性的保存,重在解決軟件、應用程序問題。
2 我國電子文件長期保存的意義
電子文件是社會的“記憶”、人類的核心戰略資源必須長久保存,做好我國電子文件的長期保存工作具有重要意義。
(1)增強國家對信息資源的控制力,發揮信息資源綜合貢獻力。馮慧玲教授指出“信息資源對國家經濟社會發展具有不可替代的、全方位的、綜合性的價值與作用”。現如今,電子文件已經成為文件的主要形式,是現代社會信息資源的重要組成部分。做好我國電子文件長期保存工作有利于改善我國電子文件失控管理現狀,提升國家對信息資源的控制力,發揮信息資源的綜合貢獻力,促進我國新一輪信息化戰略的開展。
(2)有利于促進國家歷史和民族記憶的延續。十八大指出“文化越來越成為民族凝聚力和創造力的重要源泉,要提高國家文化軟實力”。電子文件的長期保存,系關國家文化遺產的留存、文化軟實力的提升和民族記憶的延續。提高我國電子文件長期保存能力,保證電子文件的完整性、真實性、準確性,能有力促進我國歷史和民族記憶的延續,充分發揮電子文件作為當代文化傳承的主要載體作用。
(3)有利于保證電子文件可信性,發揮電子文件憑證作用。電子文件是機構在開展電子商務、電子政務或其他電子化業務中產生的憑證性記錄,是證明一個機構業務活動合法性的重要憑證。保障電子文件的可信性,有利于充分發揮電子文件在實際工作中的憑證性作用,提高社會活動的效率。
(4)有利于帶動電子文件軟硬件市場和服務市場的發展。電子文件從形成、處理歸檔、移交和長期保存的整個過程,需要電子文件的業務系統、電子文件管理系統和數字檔案館系統三個系統的協同完成。電子文件管理的軟硬件和服務市場是所有信息化市場中最大的一個。加強電子文件的長期保存能協同帶動電子文件軟硬件市場和服務市場的快速發展。
3 我國電子文件長期保存面臨的挑戰
電子文件載體的改變、計算機軟硬件技術的升級換代以及主客觀因素的變化都會影響電子文件的真實性、完整性、可靠性和長期可存取性。
3.1 存儲介質壽命
電子文件存儲介質的壽命包含形體壽命和技術壽命。形體壽命是指介質物理老化的時間。一般的CD-ROM、磁光盤以及磁盤的形體壽命是5-100年,WORM是10-100年,IBM3480、IBM3490E等磁帶的壽命是30年。技術壽命與不同類介質所依賴的技術發展速度相關,技術發展越快,介質的技術壽命越短,信息更新頻率越高,在更新過程中丟失數據的風險也更大。一般的磁帶的技術壽命高于光盤、磁盤的技術壽命為25年左右,而光盤、磁盤的技術壽命一般為10年。可見,存儲介質的壽命要遠低于電子文件長期保存期限,這種“時間上”的差異決定了存儲在某一介質上的電子文件必須經過多次遷移、復制等手段才能長期保存下去,這對電子文件的可信性帶來挑戰。
3.2 軟硬件的更迭
隨著計算機技術的飛速發展,軟硬件的更新迭代頻率變高、周期變短。大多數軟件在電子文件長期保存期限內就被升級淘汰。如微軟公司在2007年、2014年先后停止支持Windows 97 和Windows XP個人操作系統。軟件開發商和制造商快速推動著軟件的升級開發,軟件升級更快,軟件的兼容和支持的持久性受到挑戰。軟件的更迭變化引起電子文件存儲格式的變化和電子文件可讀性的差異,這容易致使電子文件數據的丟失。
3.3 不可控人為行為
電子文件形成者在電子文件形成過程中疏忽操作或為工作便利而無意損壞電子文件的原始性。電子文件保管者因失誤操作或保管不力而造成電子文件數據損壞或被盜都會危害電子文件安全。電子文件利用者無意刪除(修改)事后任需要的數據。
3.4 不可預測的自然災害
據統計,青海玉樹地震中,災區檔案館保管的13萬卷檔案中,有近萬卷檔案因辦公大樓倒塌被廢墟掩埋,其余12萬卷檔案均在地震危房中。電子文件存儲介質易受外界因素影響,不可預知的自然災害對于電子文件的保存帶來潛在威脅。
4 我國電子文件長期保存的技術策略
電子文件的長期保存是一個起始于文件形成并貫穿于整個文件生命周期的持續性過程,涉及文件形成者、保管者、利用者等多個主體,以及采集、描述、歸檔、存儲、保管、利用等各個環節,要充分運用技術手段,以確保電子文件的真實性、完整性、可靠性和長期可存取性。
4.1 遷移
電子文件的遷移是指將電子文件數據從某一環境轉向另一環境的過程。相比于其他技術,電子文件遷移技術具有獨特優勢:(1)適用范圍廣。遷移即可實現技術平臺的轉變,又支持電子文件格式的轉換以及硬件環境的變更。仿真技術是對原數據的再保存,本質上只是延緩技術淘汰。更新技術也只實現同類載體間的轉換,對于系統操作兼容性要求高。(2)遷移技術是一種可持續性方法,較能徹底的解決長期保存問題。仿真和更新技術都是針對同一技術時代的數據進行保存處理,隨著技術更迭和系統操作的不兼容,要實現后續保存的難度很大。
雖然遷移法能保證數字資源能夠被普遍接受的格式為人所用,并能被復制,但是遷移技術任具有一定局限性。遷移資源量龐大,轉化過程耗費大量時間,工作量大。電子文件的格式轉換中會不可避免的丟失一些數據。采用已經淘汰的電子文件格式或轉換工具進行格式轉化或數據遷移是失效的。
4.2 仿真
仿真是指在新的系統環境中建立原始數據、設備和管理系統的運行環境。即在新的系統環境下重建一個兼容原始數據、設備及其管理系統的運行環境,使得原來的數據、設備和系統能運行在現行的軟硬件系統上。仿真實際上是通過保護數字信息的利用環境來保障數字信息內容的可利用性。仿真技術一般包括仿真硬件平臺、仿真操作系統、仿真應用程序三個級別。比如W indows操作系統中幾乎都集成了DOS平臺,2位操作系統平臺集成16位平臺,使得原來平臺的應用程序可以在新環境中繼續使用。仿真技術可以同時重現內容和外觀形式,在某些情況下,數字文件的外觀形式是構成其完整性的重要內容,而遷移技術偏重內容的保護,經常丟失一些外觀信息。
仿真技術在理論上雖然比較先進,但其發展仍受到知識產權等因素的制約。要規避知識產權限制,仿真技術要求能及時獲取開源代碼,而當前的操作系統、應用軟件、硬件產品核心代碼處于封閉,這嚴重制約仿真技術的發展。筆者認為解決這個問題需要由具有較高信任度的專門機構來維護仿真器的開發,并出臺相關的法律意見。
4.3 開放描述與標準化
所謂開放描述,是指利用計算機可以識別的開放語言和規范方式來描述數據格式、管理機制、組織方式各層次的內容。一般而言,數字檔案文件的保存需要許多“元數據”的解譯資料來從旁協助注解,注解得越多、越詳細,其受技術過時的影響就越小。一個數字文件生成系統可以將自己的開放描述文件提交文件登記中心(或類似機構)進行注冊,第三方系統可以根據開放語言的規則讀取、識別、檢索、驗證其所產生的數字文件,只要開放描述文件有效,這類文件都能夠得到有效讀取,而與時間無關,從而達到長期存取的目的。
4.4 其他方法
此外還有不少其他的數據保存技術。(1)硬件博物館。1此法通過大量保存文件、軟件、硬件的方法來重現環境,但這種方法對于大數據量而言是很難實現的,難以維護系統的持續運轉。(2)延長載體壽命。通過改進物理載體的穩定性、存儲能力,提高載體質量,延長使用壽命,緩解媒體脆弱性的問題。(3)縮微膠片。縮微膠片的壽命可達300年,通過數字存檔機等轉換設備可以將數字檔案文件直接“拍攝”在縮微膠片上,實現數模轉換。此法廣泛應用于CAD文件、醫用X片等檔案文件的長久保存。
5 結語
電子文件的長期保存是一項起始于電子文件形成之時并貫穿于電子文件整個生命周期的活動。電子文件存儲介質的壽命、軟硬件的更新換代、不可控人為因素的破壞以及自然災害的威脅都給電子文件的長期保存帶來巨大挑戰。遷移、仿真、開放描述與標準化存儲等技術策略都只能對電子文件長期保存起到一定促進作用而無法完全解決電子文件的長期保存問題。因而電子文件的長期保存是一個復雜工作,需要在實踐中不斷創新,創新電子文件長期保存方法,以更好實現電子文件的信息資源綜合貢獻力,推動我國電子文件的新一輪發展。
參考文獻
[1]Technical Committee ISO/TC 171. ISO/TR 18492-2005,Long-term preservation of electronic docunment-based information[S].2005-10-01.https://www.iso.org/obp/ui/#iso:std:38716:en
[2]錢毅.我國可信電子文件長期保存規范研究[J].檔案學通訊,2014(3):75-79.
[3]Sanett S. The cost of preserving electronic records[J]. Computers in Genealogy, 2004,8(6):226-236.
[4]馮慧玲.檔案信息資源在國家經濟社會發展中的綜合貢獻力[R].2005年中國信息資源管理論壇,2005-05-30.
[5]馮慧玲,劉越男.電子文件管理國家戰略[M].北京:中國人民大學出版社,2011.
[6]馬林青.InterPARES電子文件長期保存政策框架及其啟示[J].檔案學研究,2012(5):59-62.
[7]張德成.淺談電子文件的遷移[J].蘭臺世界,2012(Z3):56-57.
[8]Hoke G E J, C R M. Future watch: Strategies for long-term preservation of electronic records[J]. Information Management, 2012,46(3):26-28,30-35.