摘要:長期數字保存與數字對象的維護是為了確保對重要信息不斷訪問的實現。近年來,隨著科學技術的不斷進步,數字對象的長期保存與維護是一個非常重要的問題。現實生活中,不是所有存在于組織中的信息都是長期保存的。對于大多數組織來說,當認識到信息可能遭受危險,需要采取保護行動,盡量避免損失時,技術專家需要做更多的工作,以確保所有可用的措施都到位。本文探討了長期數字保存及其意義,分析其在組織下的模式并給出合理化建議。
關鍵詞:長期數字保存;數字信息資源;數字對象維護;存儲
中圖分類號:G250.73文獻識別碼:A文章編號:2096-3157(2020)15-0131-02
一、引言
隨著科學技術的進步,數字信息資源的長期保存成為組織和企業經常使用的工具。數字信息資源是指所有以數字形式把文字、圖像、聲音、動畫等多種形式的信息存儲在光盤、磁帶等非紙介質的載體中,通過網絡通信、計算機或終端再現出來的信息。據估計,98%的組織需要確保能夠長期保存數字記錄。這是為了更好地處理法律辯護、遵守、公司的持久支持和訴訟等諸多問題。現實情況下,每一個組織都需要確保他們平常能夠對在服務器上備份的不同文件進行區分,甚至是在外部硬盤驅動器上。數字存檔被稱為只包含真正需要保存的不同文件,這些文件是正在進行的并且可以隨時訪問的有效文件。但從管理時間來看數字的長期保存,數字信息資源面臨著更大的消失和不可獲得的風險。這是因為數字信息與紙本資源相比,它對存儲介質的依賴性更強,其存儲的截止穩定性卻不強,容易遭受破壞,若是其載體一旦損壞,需要的數字信息可能就會無法獲取、利用。因此,本文將基于組織管理下的長期數字保存模式,分析其風險并針對風險及模式提出可操作性建議。
二、企業組織設置下的長期數字保存
現實生活中,企業的大多數組織都必須維持一個一個詳細的、有組織的記錄,用來記錄他們在一段時間所參與的不同的項目。本文以主營建筑類型的公司企業為例,對于處理建筑問題的大多數組織來說,需要記錄一些包括建造過程的工程的藍圖等信息。當大多數組織在寫這些記錄時,他們期望它們能夠持續整個建筑工程完成,甚至是到大約三四十年后仍然可以獲取利用。這是因為對于一個建造工程來說,在工程完成以后,如果有一些維修問題需要組織去完成,或者更夸張的情況,例如與其他企業出現系列業務糾紛、法律案件,這些都需要獲取之前的整個過程的記錄,這都需要長期數字保存的運用。
基于數字類型的多樣化,數字存儲的形式也是十分多元化的。常見的數字資源多以文檔、圖片、音頻、視頻等形式存在,同時存在于不同格式當中,表中羅列了常見的數字類型的保存形式,企業管理者針對不同的數字保存類型進行分類,并按照不同的對策進行長期保存。
基于本文的調查,各個組織機構、企業都需要存儲大量信息以備未來工作的進行。根據數字信息資源長期保存的政策與法規,各企業機構在長期保存過程中也應對諸如知識產權、用戶隱私及保護等問題作出規范。由美國空間數據系統咨詢委員會(CCSDS)提出并被國際標準化組織(ISO)采納為國際標準——ISO 14721的開放檔案信息系統參考模型,是世界范圍內數字信息資源長期保存系統所普遍遵從的核心標準。目前常見的技術大體分為以下幾種:拷貝、仿真、遷移、數字圖形輸入板、建立計算機檔案館、封裝技術、標準化技術、通用虛擬計算機技術(UVC)、基于風干的保存策略和數據再造技術,每種技術都有其優點及不足。結合上文提到的不同類型的數據信息,目前還沒有一種技術能夠全面滿足不同類型數字資源的保存需求。因此對企業來說在具體的工作與實踐當中,應當綜合考慮所處環境、保存目標、數據類型等因素,根據實際的保存需要,選擇其中多種合適的技術與策略綜合利用,進而完成數字信息資源的長期保存工作。隨著時間的推移,大多數公司正在慢慢地轉移到對云服務的利用,這其中就包括亞馬遜網絡服務、Dropbox、谷歌盒子和Office 365等著名互聯網企業。該存儲方法對于存儲企業中起決定性和十分重要的數據來說是十分便宜的,也是組織能夠利用的最有效的短期解決方案。然而,它在組織的長期運行與維護過程中卻構成了一個非常真實的威脅。對于任何企業來說,都必須認識到對于承載信息的硬件和軟件過時問題是一個恒不變的挑戰,企業必須有一個持久的解決方案來更好地抵制風險,解決面臨的困難。
從實際情況上分析,任何存儲超過10年的信息或內容都有很大的風險會使存儲其的機構、組織無法再進行讀取利用。這是因為我們目前所使用的操作系統、硬件、文件格式或者程序都以非常快的速度持續不斷的發展,因此由于時間的推移和技術的發展,最終所交付用戶的操作經驗是一個非常困難和復雜的問題,換句話說,大多數個人和組織無法考慮或理解當時這個信息的價值或利用方式。隨著越來越多的公司正努力尋找最好的方式以確保他們可以更好地存儲重要信息,當涉及到組織如何運作的法律法規時,就會發生不同的變化。因此,企業需要研究伴隨著長期數字保存的模式而面臨的風險以及可能遇到的威脅,并針對其作出合理化措施,最終找到持久的解決方案。
三、數字資源長期保存與管理的風險
本文基于對長期數字保存的介紹和分析,由于現在科技的發展,硬件、軟件更新換代的速度不可想象,再加上長期保存的信息時間久遠,對于企業來說,難免會在數字資源長期保存與維護時遇到系列困難與風險,只有正確識別數字長期保存過程中存在的風險,并系統地進行風險因素分析,科學地對風險因素分類和風險等級劃分,才能構建完善的應對策略,控制并預防數字檔案長期保存過程中遇到的風險,實現對數字檔案的長期、有效、安全保存。本文接下來將對數字資源長期保存的風險進行介紹并評估,以幫助企業提供建議。
1.存儲載體的風險。隨著科技的發展,工程中所需要的信息都是通過計算機生成、記錄并保存的,這就說明數字長期保存是無法離開承載其存儲的載體的而獨立存在的,其存儲的載體一般是計算機內部的硬件或軟件。這就說明了信息的依賴性,一定程度上可以理解為信息是“寄生”于計算機之上而存在的。而現實生活中,我們的計算機難免會遇到死機、癱瘓、被黑客攻擊或者遭到病毒攻擊的情況,這就會導致企業所需要的數字信息因為計算機軟件或硬件的易被攻擊的特性,造成信息缺失甚至被刪除、修改,無法再次讀取的情況。
2.數字信息的真實性風險。數字信息的真實性主要包括三個方面:數字信息來源正確,在存儲進載體的過程中數字信息未發生變化;數字信息存儲形式沒有發生改變,無論是內容方面還是外觀格式等方面;若在長期保存過程中進行了修改,所進行修改的步驟是要被記錄的。數字信息和我們傳統的印刷保存是不同的,基于計算機的可操作性,數字信息也是可以被修改的。若是在數字信息的保存及管理過程中,被惡意修改或者病毒入侵,數字信息都會被改變而失去價值。
3.數據的脆弱性。基于上文中提到的各種數字信息往往以不同的形式存在于載體當中,數據是數字信息的代碼,是數字信息存在的前提,若是沒有了數據,數字信息的保存就變得不可實現。但是數據是脆弱的,容易遭到黑客、病毒的攻擊,一旦破壞將永久消失。同時,承載其存儲的載體一旦發生故障,如卡機等現象,也會對存儲的數據造成影響,而數據一旦被侵犯,容易發生數據缺失甚至永久破壞,無法再次讀取的問題。
四、數字信息長期保存與維護的建議
結合實際情況,并非所有的企業、組織都需要用計算機硬盤進行數字信息的保存。然而,一旦需要歸檔的不同材料已經被識別并明確分類,企業就需要考慮合適的數字信息存儲載體來進行不同的保存活動。基于國家數字管理聯盟(National Digital Stewardship Alliance)列出的關于數字保存的建議,結合數字保存的風險,在下文進行羅列。
1.企業、組織必須確保他們能夠在一個非常可靠的存儲系統中存檔需要的信息。可以使用例如穩定的服務器,或者利用云服務的技術進行存儲。隨著時代的發展,云服務是一個比較先進的存儲技術,其不依賴于例如像USB閃存驅動器這樣的可移動介質。因為在可移動存儲系統中所存儲的數據可能會隨著時間的推移而難以訪問,甚至完全不可訪問。
2.將數字信息存儲在不同的地理位置,避免因自然災害導致的數據完全丟失。同時,組織應將重要文件都以“有風險的”格式遷移,并將其存儲于更開放和穩定的格式中。這在文件數量受到限制時是非常有用的。對于組織來說,應在數字信息保存之前對其進行審查記錄,判斷其記錄的類型并對所有內容不同類型的數據制定不同存儲文件的保存策略。
3.加強修復技術。在科學技術不斷變化的時代,數字資源可能會因技術平臺的變化而造成無法讀取識別。同時,對于因為設備死機等不可抗因素,都可能會造成數據的缺失。對于我國來說,建立數字信息恢復中心來承擔數字資源長期保存過程中的技術問題是非常有必要的。目前我國已經擁有上百家數字恢復中心,通過恢復中心針對由于硬件、軟件故障或其他災禍帶來的數據損失來進行數據信息的修復,進而找回缺失的信息,幫助數字信息長期保存。
4.加強對數字信息的檢測。對于組織、企業來說,確定數字的真實性是非常困難的。組織、企業可以利用一些工具、技術來判斷相應的獨特標識符。這些工具可以基于文件序列的二進制代碼來對文件進行判斷是否被修改或者被損壞。當發現信息的固定屬性已經發生改變時,就應該及時地做出舉措,檢查核實并修改需要長期保存的數字文件。
五、總結
數字信息的長期保存是一個任何企業和組織都必須直面的挑戰。鑒于數字信息資源長期保存工作復雜性高、實踐性強的特點,想在短時間內讓這類問題得到解決還是比較困難的,但企業和組織應該及時針對其風險進行對策研究。一旦其內部的重要信息發生丟失,組織會面臨更高的風險。對于管理者來說,應及時發現其面臨的風險,轉變管理理念、科學合理地構建完善的風險應對策略、提升風險應對能力,才能更好并安全地實現數字信息的長期保存。
參考文獻:
[1]王霞.數字檔案長期保存的風險應對策略[J].中國勘察設計,2019,(09):87~90.
[2]臧國全,崔燚,李哲.數字保存的真實性風險檢測[J].情報理論與實踐,2018,41(06):28~33+38.
[3]陳月.圖書館數字信息資源長期保存與維護的風險及策略研究[J].中外企業家,2019,(25):105~105.
[4]高凡,吳振新,付鴻鵠等.數字資源長期保存:研究進展回顧與展望——iPRES 2019國際會議綜述[J].信息資源管理學報,2020,10(02):118~127.
[5]陸泉,韓雪,韓陽等.我國數字信息資源長期保存研究綜述[J].圖書館學研究,2015,(04):2~8.
[6]Corr,E.M.,& Sandy,H.M.(2017).Digital preservation for libraries,archives,and museums.
[注]基金項目:受2019年大學生創新創業項目 “Make It Mine”量膚定制護膚平臺(編號:2019200204)
山東師范大學本科生科研訓練計劃、本科生科研基金項目扶持
作者簡介:
辛曉海,山東師范大學商學院學生。