2、歷史檔案內容的開發
《全國重點檔案搶救補助費管理辦法》明確規定:“實施搶救的全國重點檔案是指中華民族各個歷史時期遺留下來的,在政治、經濟、科學、文化、歷史和藝術等方面具有重要的研究和利用價值,國家需要永久保存的珍貴歷史檔案?!睔v史檔案的利用價值集中體現于歷史檔案所記載的內容和信息能夠給后人以參考印證、借鑒啟迪或追溯回憶。但是,作為歷史文化和古代社會產物的歷史檔案在文字書寫和文化內涵上與今有別,沒有一定的古代歷史文化、古文字知識背景難以理解其中奧妙。讀慣了白話文的世人捧起文言文都有標點斷句之苦,更難以想像去閱讀和理解幾近失傳的古代文字和少數民族文化歷史了。因此,未經內容開發的歷史檔案普及性有限,傳播范圍較窄,利用門檻較高,限制了社會對傳統歷史文化的學習和了解,需要通過采取保障措施及時進行解讀轉換,以保證其內容的長久可讀性。
第一,編纂開發歷史檔案文獻。編纂開發歷史檔案是一種學術性研究性工作,是歷史檔案整理的高級階段,是為今天和未來的歷史檔案內容利用提供方便的一種信息服務工作,它既可以擴大歷史檔案的傳播渠道和速度,又可以用通俗易懂的語言和今天的書寫習慣解讀過去晦澀難懂的古籍文獻,克服社會大眾利用歷史檔案的諸多障礙和不便。由于歷史文獻編纂從選題查找到選本選材,從轉錄點校加工到編排編輯,都有一整套完備的程序和流程,而且根據歷史檔案內容的不同需要輔之以相應的歷史背景知識,因此,這項工作只有精通歷史知識和文化的檔案專家才能勝任。肩負著歷史檔案載體保護和內容開發雙重任務的檔案工作者,應該從保護和利用兩個思路來明確歷史檔案開發重點,將開發重點放在內容解讀瀕臨失傳和社會利用頻繁的歷史檔案上,一方面優先開展文明幾近消失的古代少數民族歷史檔案的翻譯整理,一方面優先開發利用次數較高的歷史檔案內容,保證歷史檔案內容的長久可用。
第二,建設歷史檔案文化專題數據庫。綿延了幾千年的中華民族文化之所以成為世界文明歷史中最為燦爛和絢麗的一頁,主要歸功于中華文化傳承的連續性和持久性。而歷史檔案利用的持久性在連接和傳承中華文化過程中功不可沒。在信息時代繼續發揮歷史檔案的文化傳承和傳播作用,應該積極發揮現代技術的優勢,以社會利用率為衡量指標,建立歷史檔案文化專題數據庫,在保護歷史檔案內容可讀和傳播效果的基礎上,還可以減少對原件的損害,實現歷史檔案原件和內容的長遠利用。筆者認為:從目前建設基礎和利用需求來看,建立民俗文化專題數據庫、歷史名勝文化專題數據庫、中華傳統醫學專題數據庫是一種較好的建設構想。因為,我國許多地方檔案館都收藏有大量的民族歷史文獻以及實物檔案,包括各民族在不同的歷史時期中以本民族的文字形成的一批歷史文獻。同時還收藏了族譜、家譜、地方志、專業志、文化遺址、歷史名勝古跡、歷史人物、名特優產品以及地方名人檔案等具有濃郁地方特色的歷史檔案及大量與地方名勝有關的歷史資料。還有許多檔案館中收藏了許多記錄古代基礎醫療經驗的歷史檔案,如中國第一歷史檔案館保存的清宮醫案中包括給皇帝、嬪妃、太監、宮女及部分王宮大臣進行原始診治的記錄、脈案。這些寶貴的歷史檔案中記載了豐富的民俗、名勝、醫學內容,通過專題數據庫的建立可以及時進行內容信息解讀轉換,優先進行數字化保護和網絡利用,在歷史檔案及時保護和長遠利用中尋找到一條兩全之路。
第三,開展人員培訓和世界遺產教育工作。歷史檔案的內容開發具有緊迫性和傳遞性,文化解讀和內容開發必須依賴人的大腦和知識作為工具,如果破解歷史檔案內容的方法和知識不及時傳給后人或者記錄下來,一旦掌握瀕危文化的專家逝去,有些古籍檔案將成為永遠無法理解的“天書”。因此加強歷史文化知識教育和古代文化專業人員的培養,盡快整理傳授瀕危文化的解析方法,是歷史檔案內容保護的人才保障和知識支持。目前,我國高等教育中傳統國學內容、古代文化知識傳授力度有限,歷史檔案整理開發的知識儲備和人才儲備較為薄弱,使許多地區的珍貴歷史檔案內容開發陷入困境。1972年聯合國教科文組織在巴黎通過的《保護世界文化和自然遺產公約》中明確規定:“對于公約提及的、本國領土內的文化和自然遺產的確定、保護、保存、展出和遺傳后代,主要是有關國家的責任(第4條)。”“各締約國應通過一切適當手段,特別是教育和宣傳計劃,努力增強本國人民對本公約第一和二條中確定的文化和自然遺產的贊賞和尊重(第27. 1條)?!雹傥覈鳛?985年加入的締約國理應遵守這一規定,加大對文化遺產保護的宣傳和教育工作。歷史檔案是文化遺產的重要組成部分,對歷史檔案的保護需要從世界遺產高度進行教育和宣傳,進行人才培養和積累,進行學術性交流活動的開展,并加重學校課堂教學中相關知識的教授和傳播,使歷史檔案的保護和開發“后繼有人”,不出現人才短缺和斷層現象。
(二)數字檔案的存儲保護策略
歷史檔案是過去文明傳承至今的紐帶,歷史檔案的安全保護為前人所創造的文化的延續和傳遞提供記憶憑證;而越來越多地以數字形式存在和記錄的現代文明也需要通過數字檔案的有效保護來得以積累和反映。歷史檔案安全保護策略是在傳統檔案保護思路和方法基礎上發揚發展的,主要從載體和信息、預防和治理兩個角度建立保障機制。相比之下,數字檔案的安全保護需要更多知識創新和技術創新,必須遵循數字信息的存在和利用特點,從靜態和動態存儲利用方式出發分別制訂離線和在線數據保護方案,并重點強調對動態在線信息的預防監控。
1、存儲介質的保護——離線風險的防范
通過存儲介質離線保存數字信息主要是出于兩個目的:一是進行數據備份,以便在系統出錯或數據丟失時恢復歷史信息;二是長久保存歸檔數據。而后者就是一種離線數字檔案。以靜態形式脫機離線保存的數字檔案,主要存在三種可能導致檔案信息丟失的風險:一是無法抗拒的自然災害;二是人為有意破壞或者密碼丟失;三是存儲介質的損壞。而介質損壞造成的數字檔案丟失是可以通過有效的保護策略加以防范的,選擇耐久性的存儲介質并盡量延長其物理壽命是離線數字檔案長久利用的物質基礎。存儲介質受損主要有三個方面的原因:介質本身的質量和壽命、保存環境狀態的惡劣、操作不當的刮傷破壞。針對離線數字檔案保存介質面臨的三種風險,針對性地制訂保護方案,才能在數字檔案載體安全的前提下保證檔案信息的完整可靠。
第一,根據保存數據的需要選擇合適的存儲介質。目前數字檔案的存儲介質從讀寫工作原理來區別,主要是光存儲介質和磁存儲介質兩大類,各種光盤都是光存儲介質,而磁帶、磁盤、軟盤都是磁存儲介質。各種存儲介質在耐久性、速度、容量和價格上都有所不同,需要根據所保存檔案數據的價值和利用頻率進行綜合考慮,優化選擇。一般說來,存儲介質的質量與價格是成正比的,市場價格較高的介質在耐久性、容量、讀取速度上都較好,但是并非所有的數字檔案信息都有必要使用最昂貴和性能最優的存儲設備,應該根據具體情況在滿足數據保護要求的前提下講究成本節約和經濟效益。從檔案數據的保存要求和特性來看,離線存儲的數據主要是為了長期保存和長遠利用,而日常利用此類數據一般使用其工作備份或拷貝件,較少調用庫存檔案數據。因此,介質的讀取和傳送速度不是最核心的考慮因素,而應從數據永久安全和長期完整角度重點考慮存儲介質的以下性能:一是根據數字檔案的長期真實完整性要求,選擇防止數據更改的存儲介質。長期保存的數字檔案通常存儲在一次寫入、不可追加數據的介質上,以防數據被擦除或篡改。二是根據檔案數據的穩定性,選擇耐久性較強和技術壽命較長的介質。介質的物理壽命和技術壽命都會影響檔案數據保存時間,并且導致數據被迫頻繁遷移而帶來更大的丟失風險。當前存儲介質的種類繁多,組成成分各異,僅光盤在市面上就可常見金盤、銀盤、藍盤、綠盤等耐久性各異的多種類型,選擇時應該了解各種介質的組成成分,在相近價格區間內盡量選用材質受環境影響較小的種類。例如:有學者經過大量實驗證明,同樣是銀反射層的CD-R光盤,在相同環境下,酞菁染料光盤壽命為114年,而偶氮染料光盤只有11年②。三是根據存儲的檔案數據單元選擇合適的存儲容量。介質存儲容量應該與所保存數字檔案信息量匹配。存儲容量過低會導致同一單元的檔案數據分散,不利保護和完整性;但是大容量介質成本更高,因此應該根據館藏數字檔案信息量綜合考慮。
第二,根據存儲介質的特性創造良好的保管環境。適宜良好的保管環境不僅是紙質檔案保護的重要基礎,也是數字檔案載體的必要條件。如果說存儲介質的選擇與具體檔案部門的工作存在動態相關,無法籠統概括種類的優劣,存儲介質的壽命尚存在無法實際驗證的缺陷,那么數字檔案保管環境的要求卻相對較為明確,且可以根據專家意見具體操作。以光盤存儲介質為例,檔案保護技術專家們已經通過對光盤結構材料、生產工藝和老化因素的分析,明確了光盤保存環境必須隔絕有害氣體、保持穩定溫濕度、防止灰塵異物的保管要求。③ 首先,光盤保存環境要遠離生成鹵化物的場所,如常有氟化氫(HF)、氯化氫(HCl)的工業區及空氣中含有較多海鹽(NaCl)的臨海地帶;同時還要遠離使用有機溶劑的實驗室和工廠;如果使用氨氣對庫房去酸時,要對光盤采取隔離保護措施。其次,低溫干燥、恒溫恒濕的環境最適宜光盤的保存。由于光盤性能各異,適宜條件也有所差別,綜合考慮其物質特點,專家建議光盤保存較適宜溫度為14℃-24℃,相對濕度為45%-60%,且溫度變動不超過+2℃,濕度變化范圍不超過+5%。
最后,人為操作造成的存儲介質損傷是最難以預料和補救的。行為習慣的千差萬別導致恢復這類介質損傷所面臨的情況復雜多變,因此必須“防患于未然”,盡量通過規章制度和操作流程的制訂預防和減少誤操作的發生。
2、信息安全的保護——在線風險的規避
盡管目前檔案機構長期或永久保存的數字檔案信息必須離線脫機保存在存儲介質中,但是一方面,離線保存的檔案數據通常只是在線生成信息的拷貝,必須通過在線信息安全保護來保證其完整和真實;另一方面,隨著分布式數據庫等新型數字信息集成形式的出現,有些數字檔案無法離線保存,只能動態存在于計算機或網絡中。而且,自然災害的突如其來可能導致許多在線信息尚未制作離線拷貝已經喪失殆盡。所以規避在線數字檔案的風險,保障動態信息安全是現代檔案保護必須面臨和攻克的重大課題。
首先,數字檔案信息的在線保護應該根據數據價值采取遠程異地備份措施。2001年9月11日,美國世貿大廈在波音飛機的撞擊聲中轟然倒塌的一幕,至今仍然讓人心有余悸。在“911”所造成的巨大物質和精神損失背后,還伴隨著無數公司機構重要數據資料的災難性毀滅,許多公司因此在相當長的時間內一蹶不振。該中心最大的主顧之一摩根士丹利卻在災后的第二天就進入正常工作狀態,世貿雙子樓的倒塌沒有給公司和客戶的資產帶來重大損失。危機時刻,摩根士丹利花費巨資添置的EMC遠程數據防災系統忠實地工作到大樓倒塌前的最后一秒鐘,將重要的業務信息完好無損地傳送到了幾英里以外的另一個辦事處。④ 遠程異地備份措施在這次大劫難中將在線數據損失降至最低程度。
隨著企業信息化進程的加快,越來越多的公司將原先分散的數據集中保存至一個容量巨大的數據中心,這種高密度的數據集成方式在降低成本的同時,也使在線數據丟失風險集中化。作為容納和保管大量數字檔案信息的檔案機構本身就是一個集成化程度極高的龐大數據中心,隨著數字檔案信息的成倍遞增,在線數字檔案管理和利用系統的普及,這種原本只有銀行、電信商等數據密集型機構才面對的數據丟失風險漸漸直逼檔案部門,不得不引起檔案界的普遍重視。然而,僅靠離線脫機的備份方式進行數字檔案信息保護顯然具有滯后性和局限性,尤其是在遭遇災難性打擊時更是無法保證數據安全。借鑒許多世界級企業高密度數據中心安全保障的經驗,檔案部門也應該逐漸加大對數字檔案存儲備份技術的投入,有選擇地考慮遠程異地備份等數字容災系統的建立和運行。當然,遠程異地備份系統是數據備份的最高級模式,主要針對不斷動態變化并且價值極高的數據信息,而且耗資較大,不是一般的檔案機構所能承受和有必要采用的,但是,遠程異地備份的保護思路卻是檔案部門值得學習和采納的。目前,已有一些小型公司定期通過小型磁帶機對服務器進行備份,并將數據傳輸到一定距離以外的安全地區存儲,用簡單廉價的方法實現遠程備份系統同樣的作用和功能。檔案部門完全可以做到對館藏數字檔案進行價值分級,為價值較高的重點數字檔案做遠程備份,為長久保存數字檔案信息再添一道安全防護屏障。而且,隨著社會信息化水平的不斷提高,數字檔案信息和電子文件的不斷增長,國家級數字檔案館或國家檔案數據中心的建立不會永遠停留在設想階段,在國家級檔案數據中心建立之初,就需要盡早制訂高級別的安全備份方案,未雨綢繆地保護數字檔案信息的安全。
其次,數字檔案信息的在線保護應該建立元數據管理體系。在線數字檔案的信息載體分離和信息易變性使得其安全風險不僅存在于“海量”信息丟失方面,而且更大程度上體現于因修改方便導致的信息失真和因格式技術更新導致的信息無法讀取。數字檔案的增刪操作簡單便捷,僅從電子文本上無法體現其“原始性”和“真實性”,必須借助對操作過程的記錄和原始文本特征的描述才能識別哪些是“初始版本”,哪些是“修改版本”。同時,由于數字技術和文件格式隨著市場上的軟硬件升級而不斷變換,數字檔案為保證長期可讀也相應地需要載體遷移和格式轉換,變遷過程中存在數據丟失風險,必須通過對原始信息的特征記錄保證遷移前后數據的一致性。為了規避數字檔案信息的潛在風險,國內外已經開始借助圖書情報領域較為成熟的元數據技術防范離線或在線數字檔案的安全威脅。由于元數據本身是對數字檔案動態變化的及時記錄和反映,所以在線的動態檔案信息安全對元數據技術的依賴更為突出。
1998年,在美國Getty信息研究所對元數據進行專項研究而出版的有關專著中,元數據按照功能被分為管理型、描述型、保存型、技術型和使用型五個類型。⑤ 其中與信息資源的保存管理相關的保存型元數據對于數字檔案信息的在線保護具有重要意義。在探索如何利用元數據保護數字信息方面,相關領域的專家們一直在不懈努力,并提出兩類元數據模型和方案:一是綜合各領域元數據特征的基礎類元數據模型,如都柏林元數據集;另一類是圖書、檔案各專業領域內的專業類模型,如澳大利亞聯邦政府文件保管元數據標準等等。目前,我國檔案界的元數據模型體系構建仍然處于探索攻關階段,尚無成熟的研究成果。從數字信息資源和網絡信息資源的管理趨勢來看,保存動態數字檔案信息必須要集中力量建立檔案部門適用的元數據管理體系,才能在未來的數字化信息海洋中不迷失方向。
數字檔案信息的在線保護是信息化時代給檔案保護工作提出的新挑戰,并給檔案的長遠利用帶來了許多管理和技術上的問題,并非一朝一夕依靠若干項新技術新方法就能得到徹底解決,這一領域的探索和創新將會是檔案界在21世紀的核心課題和任務。
注 釋:
①李華明:《世界遺產代際公平探析——對我國世界遺產管理的法律思考》,《湖北民族學院學報(哲學社會科學版)》2004年第3期。
②唐躍進:《CD- R光盤的耐久性與光盤檔案保護》,《檔案學通訊》2004年第5期。
③郭莉珠:《檔案保護技術學教程》,北京,中國人民大學出版社,2000年版,第100、101頁。
④⑤崔 毅轉載:《數據遠程備份幫摩根士丹利幸免于難》,互聯網,http://home.donews.com/donews/article/1/16741.html,2007年2月9日。
作者單位:中山大學信息管理學院