翟宛東



摘 ?要:數字信息長期保存是我國檔案事業關注的重點問題,能否通過構建可信數字倉儲實現數字信息的長期保存與存取,是我國檔案事業在未來的發展中值得思慮的問題。Core Trust Seal Trustworthy Data Repositories Requirements(2020–2022)從組織架構、數據對象管理和技術三個維度16個角度開展可信保障工作評估。本文分析其整體框架得出,提升數字倉儲可信度的準則在于確保所存儲數字信息資源的真實性、完整性、安全性和可用性,數據可信是數字倉儲可信的關鍵。在此基礎上,進一步思考保障數字倉儲可信度的核心問題,為數字倉儲機構提升自身可信度提供參考。
關鍵詞:數字倉儲;數字信息;長期保存;可信
Abstract: ?Whether the long-term preservation and access of digital information can be realized by building a trustworthy data repository is a question worthy of consideration in the future development of China's archival undertaking. Core Trust Seal Trustworthy Data Repositories Requirements(2020–2022)evaluates the work of credibility assurance from 16 perspectives and three dimensions: organizational structure, data object management and technology. By analyzing its overall framework, this paper concludes that the criterion to improve the credibility of data repositories is to ensure the authenticity, integrity, security and availability of stored digital information resources, and the data credibility is the key element. On this basis, the core issues of ensuring the credibility of data repositories are further considered to provide reference for data repository institutions to enhance their credibility.
Keywords: Data repository; Digital information; Long-term preservation; Trustworthy
2020年3月30日《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》發布,將“數據”納入與土地、勞動力、資本、技術并列的生產要素,[1]數字信息資源被視為國家重要信息資產,對知識積累、文化記憶和經濟社會發展等發揮著重要作用,對數字信息資源的保存成為保護人類文明記憶、提高一國國際競爭力的重要因素。[2]可信數字倉儲的構建與實施也是實現數字信息資源長期保存與存取的一項重要任務,其中可信保障又是構建數字倉儲的焦點問題。
《信息與文獻 數字文件第三方可信數字倉儲》中將可信度保障進一步分解為,保障數字文件的真實性、可靠性、完整性和可用性。[3]Lin Dawei等作者認為,數字倉儲必須提供透明、真實和可核查的實踐證據,利益相關者可以確信數字倉儲在約定的時間內有能力確保數據的完整性、真實性、準確性、可靠性和可訪問性。[4]
數字資源是構建國家記憶的基礎,資源的多寡、可獲取性和可用性等影響著國家記憶的構建效果。為此,亟須建立總量豐富、存取方便的數字倉儲,以更好滿足國家記憶的資源需求。[5]
當前國內對可信數字倉儲的研究主要集中在數字信息資源的長期保存、數字倉儲構建和可信數字倉儲的認證。金彤認為,在當今世界TDR的理念甚為重要,任何信息保管單位都面臨保存與利用工作中的種種困難。TDR有著廣闊的發展前景,但目前來看并不樂觀。聯合其他項目進行綜合性的研究與推廣,同時推進標準的國際化。有利于提升TDR的認可度。[6]
徐擁軍等作者在介紹加拿大圖書檔案館可信數字倉儲數字保存策略的基礎上,指出我國可以在協作、標準、前端控制以及數字資產攝取環節這幾個方面借鑒其成功經驗,探索適合我國數字資產的保存策略,構建統一集成的國家數字資產體系。[7]
王曉山認為,高校構建可信數字倉儲,應圍繞可信數字倉儲的屬性框架及責任框架,明確目標、落實責任,制定并逐步完善政策,積極爭取資金支持,夯實IT基礎管理,積極進行實踐。[8]
楊璐認為,數字資源的管理本身就具有一定的風險性,數字倉儲中保存有大量數字資源,未被認證的數字倉儲不能被信任,只有“DR”轉化為“TDR”時,才能夠保證這一倉儲值得信賴,貿然將資源存放于未被認可的數字倉儲中增加了數字資源長期保存的風險。可信數字倉儲認證是數字檔案館建設的必然要求。[9]
CoreTrustSeal數字倉儲認證為評估數字倉儲是否可信提供了基準,并有助于確定數字倉儲的優缺點。《Core Trust Seal可信數字倉儲指南(2020-2022)》(以下簡稱《指南》)是由WDS及Data Seal of Approval(DSA)組織聯合推出的認證體系,[10]從組織基礎架構、數據管理、技術能力等三個大的維度,對數據知識庫的工作使命、專家團隊、數據質量控制、工作流、硬件基礎、數據安全等16個角度進行評估,致力于促進可持續發展和可信賴的數據基礎架構。
《指南》旨在為可信數字倉儲提供認證服務,其適用范圍非常廣泛,不僅包括檔案館,還包括圖書館、博物館、機構知識庫和出版物存儲庫等。通過獲得認證,數字倉儲可提供證明其可持續性和可信賴性的證據。
1 《指南》的思路及其核心
1.1 《指南》的思路。《指南》從組織架構、數據對象管理和技術3個維度、16個角度開展可信保障工作評估,見圖1。
《指南》明確提出針對組織架構的要求是:數字倉儲要有充足的資金支持,并且要配備較高專業素養的工作人員,通過明確的制度管理以確保所存儲數據的長期保存和獲取。其中使命/范圍、許可/授權、訪問連續性、保密/倫理、專家指導都是組織架構中密切相關的內容。
由圖1以及《指南》中的詳細描述分析得出其整體思路是:數字倉儲需要具備完善的組織架構,有組織有計劃地開展數字對象管理工作,并借助一定的信息技術來保障所存儲數據的安全、真實、完整和可用,以保證用戶對數據合理的訪問、獲取和理解。在可信數字倉儲的要求中,完善的組織架構是對數據進行管理和長期存取的基礎,對數據對象的管理以及采取安全技術措施是為了確保所存儲數據的長期保存和利用。
1.2 《指南》的核心觀點。從《指南》整體思路可以看出其核心觀點,即數字倉儲機構通過科學的手段管理所存儲的數據,保證其真實性、完整性、安全性和可用性,達到對所存儲數據的長期保存與可理解的目的,以發揮數字信息資源自身重要的價值,滿足用戶的合理需求。
《指南》中明確要求,數字倉儲的使命是對其管理域中的數據提供長期保存和訪問服務;數據對象管理的目標是確保數字倉儲要保證數據的完整性和真實性;采用技術手段的目的是通過使用適合的軟硬件技術,保護數據、用戶等方面的安全。《指南》中“access”“reuse”等具有獲取和利用含義的詞,與“integrity”“authenticity”“security”具有完整、真實、安全含義的詞交叉重復出現50余次,這些詞匯將數字倉儲的組織架構、數據對象管理和技術緊密聯系起來。由此可見數字倉儲的可信保障要以保障電子文件的四性為準則。
2 《指南》的主要內容
《Core Trust Seal可信數字倉儲指南》對可信數字倉儲提出了各項要求,希望數字倉儲在達到可信數字倉儲認證的各項要求的過程中,不斷地提升數字倉儲的可信度,實現數字倉儲的可持續發展。
《指南》的主要內容包含16個方面,結合相關材料將其歸為三大類進行論述。
2.1 使命目標和法規倫理。《指南》中數字倉儲的使命和訪問連續性要求與數字信息長期保存與存取的目標一致,能夠滿足人們對數字信息資源管理的要求。使命是根據應當承擔的社會責任、義務以及由自身發展而規定的任務,數字倉儲的使命是保證其管理范圍內數據的有效訪問和長期保存,為數字倉儲管理目標的確立與戰略的制定提供了相應的依據。使命擔當在數字倉儲可持續發展中起著統率作用,而目標是數字倉儲開展具體工作的方向,它就像一顆引導星,為數據管理工作引導方向。
《指南》中數據完整性、評價、數據質量、數據發現和識別、數據重用以及安全,這六個方面從不同的角度描述了數字倉儲在開展數據管理工作的過程中要達到的目標:保障管理域數據的真實性、完整性、可用性和安全性。
《指南》中在對許可和保密的要求中明確提出,各項相關數據管理工作的開展都要以遵守相關法律法規和道德規范為前提,并制定所有與數據訪問和使用相關的使用許可,這些要求與我國電子文件安全管理的要求不謀而合。法律是國家制定或認可的行為規范,法律是最高的社會規則。倫理道德在本質上是一致的,是調整人與人之間以及個人與社會之間關系所提倡的行為規范的總和。
如圖2所示,提升數字倉儲可信度的關鍵在于保障數據可信。這就要求數字倉儲在管理數據過程中,要始終遵守法律法規、倫理道德,在使命的指引下制定數字倉儲可持續發展戰略,與此同時,既要保證數字倉儲物理環境的安全,也要采用軟硬件技術手段保證管理域數據的安全,從而滿足所存儲數據的可信要求。
2.2 戰略規劃和詳細計劃。《指南》中組織架構維度訪問連續性要求,數字倉儲要制定一個連續性計劃,保障所存儲數據的長期訪問和存取。保存計劃方面的要求描述了數字倉儲應該有計劃地開展數據管理工作,并形成相關工作記錄;記錄存儲程序方面要求數字倉儲在進行數據的歸檔存儲時應當采用文檔化的流程,記錄完整的數據管理過程;工作流方面也要求對數據獲取到數據分發的工作流程中形成的相關數據進行歸檔。從數據對象管理要求來看,保障所存儲數據的完整性和真實性是數字倉儲可信的前提條件。
數字倉儲的構建并不是傳統的檔案管理思維與計算機技術的簡單堆砌,數字倉儲的可信保障是一項持久且與時俱進的系統工程。這就要求數字倉儲機構在構建數字倉儲之前要做好長遠規劃,積極響應國家數字信息資源戰略及各項政策的號召,順應數字信息資源長期保存與存取的發展潮流,結合機構自身發展態勢以及其業務能力找準定位,認真做好關于數字倉儲未來發展的戰略規劃。
與此同時,數字倉儲機構還要做好充分的準備,在遵守國家法律法規的前提下,結合相關信息管理和檔案管理標準,制定出滿足數字信息資源長期保存要求且能夠適應信息技術發展的規章制度與具體工作流程等各種詳盡計劃。
2.3 組織基礎設施——“軟硬”兼施。《指南》中在組織架構維度要求,數字倉儲的構建既需要合格的工作人員、足夠的資金,又需要專家團隊支持,并且要制定明確的管理制度,以確保數字倉儲管理任務的有效執行。在技術維度的技術架構方面要求,數字倉儲管理要有良好的操作系統和其他核心軟硬件技術來共同保障數據管理工作的有效又安全的開展。因此在構建數字倉儲時,先進的軟硬件技術設施和優良的專家團隊是維護數字倉儲正常運轉的必備條件。
數據對象的管理工作需要在安全保密場所、借助計算機等設備開展進行,數字倉儲的構建同樣離不開物理環境的支持。數字倉儲機構在安全保密工作場所的選擇、涉密計算機服務器等硬件基礎設施的配備以及相關數字信息資源管理信息系統和技術的采用方面,無一不需要充足資金的投入。
此外,為了保證管理工作的有序開展,離不開專家團隊的指導和支持,同時需要配備管理型人才、具備扎實計算機專業的技術型人才,以及檔案學等專業信息型人才。對工作人員定期進行安全保密、專業知識技能等培訓,提高他們的安全保密責任意識和專業知識素養;積極征求工作人員的意見,為工作人員提供隱性知識交流機會、促進知識共享,創造性地運用知識來提高工作人員的工作能力與數字倉儲機構競爭力和服務能力。
3 數字倉儲提升可信度的關鍵
3.1 協同合作構建。可信數字倉儲的構建需要多方共同參與,協同構建是數字倉儲可以考慮選擇的模式之一。建議協同構建的主要原因如下:
一方面,可信數字倉儲的管理具有交叉融合的特點,不僅僅需要具有檔案學專業知識的人才,也同樣離不開計算機技術型人才的參與;另一方面,可信數字倉儲的構建需要一定的資源支撐,多方合作能夠節約資源成本,發揮各方資源優勢,從而達到事半功倍的效果。如高等院校能夠為其輸入具有檔案學、計算機等專業背景的人才;信息管理方面的公司能夠為其提供資金方面的支持等。
2018年成立的蘇大蘇航檔案數據保全中心,就是一個協同構建的成功案例。蘇大蘇航檔案數據保全有限公司采用產學研一體化模式,是由蘇州大學、蘇州工業園區蘇航檔案服務有限公司、上海泰宇信息技術服務有限公司合資成立的,專業從事檔案數據保全服務的高新技術企業。
在協同構建過程中各個機構不僅能夠互相支持,還能夠起到互相監督的作用。此外,數字倉儲可信度的提升還有賴于組織的信息公開,增加數據對象管理規范的透明度,理所當然地能夠增強用戶群體對數字倉儲的信任感。建議可信數字倉儲在管理電子檔案及其元數據的同時,將其參考的電子文件與元數據方案相關的法律法規(如《電子文件歸檔與電子檔案管理規范》(GB/T 18894-2016)、《文書類電子文件元數據方案》(DA/T 46-2009))等,詳盡陳列在數據管理規范參考依據當中。
3.2 全過程管理理念。數字倉儲的管理離不開切實可行的規劃,也離不開全過程的管理理念的指導。這就要求數字倉儲管理者要樹立全過程管理思想,在數字倉儲構建伊始,就要牢記保證數據長期保存與獲取的使命,并在這一使命的指引下明確目標,進而形成切實可行的戰略規劃,將其融入具體的數據管理流程當中。
數據倉儲要制定明確的數據接收制度,與其相關的元數據也要一并接收。在進行接收時要遵循嚴格的工作流程,并辦理相關的交接手續,保證接收過程的責權明確,從源頭上保證所接收數據的可靠和可信。[11]在接收數據時要對數據的真實性、完整性、安全性和可用性進行檢測,之后再開展鑒定工作,對滿足要求的數據及其元數據進行封裝歸檔。歸檔工作結束后,并不意味著整個數據管理過程都要結束,在整個數據管理過程中仍要不定期地開展“四性”檢測工作。
同時,數字倉儲要制定訪問連續性計劃,對其所存儲數據進行分析、賦予檢索標識,為合理地訪問和獲取所存儲的數據奠定基礎,同時要有足夠的元數據來支持數據的重用,幫助用戶理解和使用數據,見圖3。
此外,在開展具體的數據管理工作時,要及時記錄實際的操作流程,并形成相應的文本化文件,以備日后查證考究。為了確保數據的長期可讀性,既要保證所存儲數據的完整,又要保證相關元數據的完整。
元數據是保障電子文件四性的有效手段,它可以跟蹤和記錄文件在整個生命周期中的狀態、結構和完整性。因此在數據管理過程中,不僅要以文本的形式及時記錄管理工作的過程,還要利用捕獲等技術手段及時捕獲與所存儲數據相關的元數據,以達到數字信息資源長期存取與可用的目的,從而增強數字倉儲的可信度。
3.3 技術。數字信息的形成依賴計算機等軟硬件設備,數字倉儲的構建和維護同樣也需要大量軟硬件技術的支撐。在信息安全層次中,安全物理環境、軟硬件技術共同保障信息的安全的要環節。根據計算機發展的“摩爾定律”,計算機平臺更新換代的周期平均為18個月,新設備、新的處理方法與軟件以2~5年為一個周期更新換代。
隨著科學的發展,計算機技術的更新換代周期甚至會更短,這就導致數字倉儲在整個存儲與提供利用的過程中會面臨著一些安全性方面的挑戰。因此在構建數字倉儲時,強大的軟硬件技術和安全保障措施是促進數字倉儲可信不可或缺的條件。這就要求數字倉儲在接收客戶所提交的數據信息包時,采用高技術、新手段來實現數據的完整接收和準確讀取。此外,所存儲數據的安全保障,包括保證數字倉儲物理環境的安全,以及采用信息加密技術、信息認證技術等技術來保證電子檔案內容邏輯上的準確。
由此可見,保障所存儲數據的安全也離不開信息技術的支持。在數字環境中維護信息的可存取性主要問題不在數字媒體,而是使數字信息如何隨技術更新而一代一代向下流傳。因此在對電子文件實施載體和信息安全保護基礎上,可信數字倉儲還要借助信息拷貝、遷移、仿真、再造等技術實現數字信息的長期可存取性。
最后,數字倉儲機構還要積極引用適用于數字倉儲管理工作的各項技術,并結合具體的數據對象管理工作進一步地進行優化和創新開發,以更好地配合數字倉儲機構的實際管理工作的正常運轉。
4 結語
數字倉儲的可信保障分析研究可以支持規劃、協助組織提高數字信息長期保管的連續性,并增加數字倉儲的透明度和對社會的責任。《指南》對構建可信數字倉儲具有參考價值,以期提升數字倉儲的可信度,贏得社會對可信數字倉儲的認可。
我國各級各類檔案機構以及擁有數據信息資源的其他類型的組織,可以參照《指南》完善自身的不足,提高數字倉儲的可信度。綜上所述,可信數字倉儲中信任原則本身并不是真正的目的,而是為了促進與所有利益相關者的溝通。數據倉儲在開展可信保障具體工作時,要注意以下三個方面的問題:
4.1 數字倉儲可信度依賴于透明度,透明度依賴于信息公開。因此,數字倉儲要切實推進數據管理過程和數據管理參考規范和標準等相關信息的公開,把數據管理公開工作作為不斷提高數字倉儲透明度和公信力的重要內容,作為密切聯系簽約用戶和潛在用戶的有效途徑,推動數字倉儲的數據管理工作再上新臺階。
4.2 數字倉儲可信度需要數據管理工作的支撐,要以保障電子文件的四性為基礎對數據對象進行管理。電子文件的四性是判定可信與否的基石,數字倉儲理應在電子檔案數據攝入環節增添四性檢測與核對工作,運用組件功能實現自動比對驗證,以確保電子檔案在入庫時的四性。同時,四性驗證工作應融入整個數據對象管理流程當中,運用一定技術手段實現四性的動態監測和實時預警。
4.3 數字倉儲可信度離不開技術支持,計算機技術為可信數字倉儲的構建提供了可能。如果說電子文件管理思想是可信數字倉儲的靈魂,OAIS功能模型為可信數字倉儲構造了軀殼,那么技術便是數字倉儲生命中不可或缺的血液。因此,對于數據倉儲工作者來說不能忽略和抵觸新技術,而是要以積極的心態認真學習掌握新技術,鉆研開發適用于數據倉儲的技術,將其運用到數據倉儲管理工作中,為數據倉儲注入新鮮血液,助其永葆活力。
參考文獻:
[1]中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見[N].人民日報,2020-04-10(001)
[2]馬費成.保存中國的數字記憶[N].人民日報,2016-03-04(007)
[3]ISO/TR 17068-2017,《Information and documentation — Trusted third party repository for digital records》[S].
[4]Lin Dawei,Crabtree Jonathan,Dillo Ingrid,et al.The TRUST Principles for digital repositories.2020,7(01):144.
[5]楊文.運用數字人文構建國家記憶[EB/OL].http://www.cssn.cn/zx/bwyc/201808/t20180802_4522538.shtml,2021-5-4.
[6]金彤.可信任數字倉儲(TDR)發展趨勢的研究[J].數字與縮微影像,2011(01):1-4.
[7]徐擁軍,張倩.加拿大圖書檔案館的數字保存策略——可信數字倉儲[J].檔案學研究,2014(03):90-96.
[8]王曉山.高校構建可信數字倉儲策略研究[J].蘭臺世界,2013(08):30-31.
[9]楊璐.可信數字倉儲認證:必要性、標準與主體[J].北京檔案,2014(05):19-22.
[10]Data Repositories Requirements[EB/OL].[2020-12-28].https://www.coretrustseal.org/why-certification/requirements/.
[11]馮惠玲,劉越男等.電子文件管理教程(第二版)[M].北京:中國人民大學出版社,2017:146-154.
(作者單位:中國社會科學院大學經濟學院 來稿日期:2022-08-20)