王亞旭
摘 要:隨著企業數字檔案館建設的日益發展,數字館藏資源呈現出數據量大、數據類型多、利用高效等特點,從根本上改變了傳統檔案館的工作模式和服務方式,使得檔案工作從業者角色從傳統意義上的“管檔案”向“管數據”方面拓展,為檔案服務工作的開展提供了更為廣闊的發展空間。本文對企業數字檔案館建設中如何對構建數據資源管理體系進行了研究。介紹了數字檔案館建設中數據資源管理方面存在的問題,并分別從管理層面、數據的長期保管和高效利用等技術層面對數據資源管理體系的建設等進行探討與分析。
關鍵詞:數字檔案館;數據資源;問題研究
企業數字檔案館建設中的數據資源是指通過對企業各類信息系統中形成的電子文件及其元數據歸檔和對紙質等傳統載體檔案進行數字化加工,以數字形式存儲的各種數據檔案信息。是企業科研、生產、經營活動的重要見證和記錄,是一種不可再生的信息資源,具有重要的社會價值和經濟價值。近年來,大數據、云計算、云存儲技術作為新興計算機信息技術受到社會的高度關注,對傳統的生產、生活方式帶來了巨大的沖擊,檔案管理工作同樣也不例外,在數字檔案館建設背景下如何做好館藏數據資源的管理,推動檔案管理服務工作的核心業務和管理模式向數字化、信息化進行轉變,具有十分重要的研究意義。
1 數字檔案館下館藏數據資源的特征
大數據時代背景下數字檔案館建設能夠實時捕獲具有歸檔價值的電子文件,能夠實時對電子文件進行自動標引,使得檔案的歸檔范圍得以進一步擴大,各種類型的檔案資源庫建設也日趨成熟。檔案收集由傳統模式下的移交歸檔轉變為對數據實時、自動歸集的接收,歸檔范圍的擴大和大量信息系統數據的積累使得企業數字檔案館中的數據資源同樣具有通常人們所認為的大數據的4V特征。
1.1 大量(Volume)
2013年10月10日,楊冬權在全國數字檔案館(室)建設推進會上的指出,至2012年底,北京市和各區縣檔案館共完成紙質檔案數字化8759.5萬頁,接收電子檔案約48TB(萬兆字節),市檔案館已完成紙質檔案數字化4397萬頁,占館藏63%。上海17個區縣檔案館檔案數字化共超過3.6億頁,占館藏50%以上,部分區縣達90%以上,民生檔案數字化率全部達100%。數據資源存儲單位從過去的GB到TB,直至PB、EB。隨著信息化技術手段的不斷完善和應用,企業辦公自動化(OA)、計算機輔助設計(CAD)、計算機輔助制造(CAM)等方面等多種信息系統的應用,伴隨著大量的數據的產生,這些都將成為數據資源的來源。
1.2 高速(Velocity)
數字檔案館利用計算機技術、網絡通信技術和數據庫技術等,使館藏數據資源信息實現共享化、信息傳輸網絡化,用戶可以突破傳統檔案館在時間和空間上的限制,借助于網絡終端來獲取所需的各種數據信息,加快了信息傳遞的速度。在數字檔案館環境下,人們不用到檔案館就能夠查詢到所需要的檔案信息,滿足人們多方面的信息需求,甚至可以通過分析用戶行為主動提供個性化信息定制推送服務。
1.3 多樣(Variety)
大數據時代下的數據格式越來越多樣化,涵蓋了文本、音頻、圖片、視頻等不同類型的數據。目前,國家標準《電子文件歸檔與管理規范》(GB/T18894-2002)中規定了8種電子文件類型作為長期保存推薦格式,包括文本文件(T)、圖像文件(I)、圖形文件(G)、影像文件(V)、聲音文件(A)、超媒體鏈接文件(O)、程序文件(P)和數據文件(D)。從數據類型和數據專業分類的上呈現出多樣性的特點。
1.4 價值(Value)
這是企業數字檔案館中館藏數據資源的核心所在,其包含的社會價值和經濟價值無法估量。因此需要對這些寶貴的數據資源信息開展安全、有效地存放與保管,做好備份工作,確保數據資源的安全、長期可用和高效利用。
2 數字檔案館下數據資源管理存在的問題
2.1 數據資源的長期存取問題
技術的發展使得檔案數據資源的數量急劇增長,但是關于數字檔案長期保存的問題仍然沒有得到全面的解決,數字檔案信息是記錄在一定物理載體上,需要借助一定的軟硬件才能被讀取和利用,其存儲時間的長短在很大程度取決于物理載體性能的好壞,而計算機技術的更新換代速度很快,在過時的計算機軟硬件平臺上能讀取出的不一定能在當前或未來的平臺上讀取出,這種不能被存取的信息,其壽命再長也是無用,因此,如何延長數字檔案的壽命成為數字檔案館建設研究的重要問題。
2.2 電子文件的真實性問題
“原始記錄性”作為檔案的本質屬性,正是由于這一特性 ,使得檔案區別于其他事物從而具有了憑證作用,具有了法律效力。然而,在大數據背景下,電子文件的表現形式則多種多樣,如音頻、視頻文件,圖形、圖像、數據庫文件,以及超媒體文件等,內容和載體的可分離性,如何確保此類電子文件在產生、處理、保管和遷移過程中能夠繼續保持原有的固化形式,確保內容信息完整且不被篡改,具備紙質檔案的原始性、完整性和真實性,成為數字檔案館建設中數據資源管理需要解決的首要問題之一。
2.3 潛在的網路安全風險
在網絡環境下影響數字檔案館正常運行的因素主要有以下幾個方面:一是計算機軟硬件及相關組件故障產生的問題。如元器件老化或損壞,系統不穩定等;二是人為破壞與干擾產生的問題。如黑客侵入、惡意信息等,導致非法訪問、非授權訪問,竊取、篡改或者偽造相關數據信息,造成文檔泄密。三是木馬病毒和間諜程序所產生的安全問題,通過截獲、竊取、破譯等手段來獲得重要機密信息。這些潛在的安全隱患是數字檔案館建設過程中不可回避而且要需要解決的。
2.4 重大自然災害的威脅
在數字檔案館建設的過程中,同時要面臨一個重要的問題,即數字檔案館遇到自然災害破壞時所帶來的巨大損失。構成數字檔案館的計算機硬件、軟件及其相關組件對環境具有較強的依賴性,在其使用和保管過程中會受到主客觀因素的影響,一旦發生如水災、火災、地震等自然災害時,會導致數據完全丟失或者系統無法保持原有的有續存儲狀態,就會對數字檔案館館藏數據資源產生很大的破壞,有的甚至是毀滅性的。
3 具體應對措施
數字檔案館下數據資源的長期有效保存與維護,是一項極其重要而復雜的工作。在建立一套技術與管理并重的數據資源安全保障體系的同時,應充分考慮環境、設備、技術、人員及電子文件的特點等綜合條件,制訂好應急預案,完善災難備份、恢復機制,提高應急處置能力,建立一套科學的、可行的、指導性的數據管理安全規范,使數字檔案館的建設有章可循,有法可依,確保數字檔案信息的可靠、可用、不泄密、不被非法篡改等,確保檔案數據原始記錄性的本質屬性。
3.1 管理層面
從管理層面上來說,關鍵是要建立并執行一整套科學、合理、嚴密的數據資源管理制度,從每一個環節堵塞數據資源在信息安全上可能存在的漏洞,這些環節包括從電子文件形成、處理、傳輸、收集、積累、歸檔,到電子檔案的保管、提供利用的全過程,即電子文件全生命周期管理,任何一個環節疏于管理,都有可能導致電子文檔信息的丟失或失真。
具體措施應該包括加強對與電子文件形成、傳輸、管理、保存等活動相關的責任者的管理;電子文件的全生命周期必須是可控的或者是可以追溯的,防止電子文件被非法的更改或破壞;電子文件形成后要及時積累;建立和執行科學的歸檔制度;制定和嚴格執行電子文檔的鑒定、保管制度和標準;加強對電子文件利用活動的管理;建立數據資源管理記錄系統等。
3.2 技術層面
1)建立用戶訪問控制體系。訪問控制是網絡環境下電子文檔信息安全防范和保護的主要措施和手段,主要是為了保證包括電子文檔信息在內的數據資源不被非法訪問和非法使用。具體措施包括:(1)訪問控制。根據用戶角色(工作性質、崗位職責、涉密等級、職務等級等)對用戶數據權限進行限定,通過系統管理員配置,實現對用戶ip地址身份進行自動識別來控制訪問內容和時間;(2)權限控制。用戶對于被授權訪問的內容(目錄、文件和其它資源)能夠執行哪些操作,如只讀、修改、創建、刪除、復制和打印等。(3)防火墻控制。通過設置安全策略,對用戶客戶端IP地址或者網卡的MAC地址進行判斷和識別或對可疑數據包進行檢測過濾,控制(允許、拒絕、檢測)出入網絡的數據包,實現限制未被授權的用戶進入內部網絡,過濾掉不安全的數據包,保證整個網絡系統的安全運行。
2)加密技術。通過加密技術實現數據、文件、口令和控制信息的安全傳輸,以確保電子文檔內容的非公開性。在多數情況下,通常采用“雙密鑰碼”的方式進行加密,將常規密碼和公鑰密碼結合在一起進行使用,發送方使用公開的加密密鑰對文件加密,收方使用嚴格保密的解密密鑰對收文進行解密,由于加密和解密使用不同的密鑰,因此第三者很難從中破解原文的內容,從而確保電子文檔在傳輸過程中的安全。
3)數字簽名技術。通過符合《電子簽名法》中規定要求的第三方機構提供的簽名及簽名驗證技術,給電子文件附加一些特征固化的標識性信息,以便對電子文件的完整性和真實性進行驗證,來確認其內容是否被篡改或是否為偽造。其目的是通過數字簽名技術可對網絡中傳輸的數據信息進行加密和解密、數字簽名和簽名驗證,來阻止非法用戶和合法用戶的非合法操作,確保傳遞過程中數據信息的保密性、完整性,以及信息交換實體身份的真實性、簽名信息的不可否認性,從而保障數據資源信息的安全性。
4)備份和恢復技術。通過在線備份,本地備份、異地保存,異質異地保存等多種技術手段建立備份與恢復機制,一旦發生數據信息丟失或失真,也能做到有備無患,只要啟動該機制,系統就能重新恢復到原來的面貌。這是一種防止電子文檔信息丟失或失真的補救措施,可以在應急和重大災害發生時保障重要數據的安全、有效可用。
4 結論
數字檔案館的建設使得傳統理論下對實體保管對象的關注,轉變成對文件、文件形成者及其過程的有機聯系和可靠性的關注,即我們所說的“后保管時代”。這些超出了傳統檔案管理范疇,給檔案工作也帶來了諸多挑戰,檔案工作者要適應未來的工作挑戰,必須要加強對數字檔案館建設背景下數據資源管理問題的研究,盡快掌握現代化管理的有關知識和技術以適應未來檔案工作的新變化。
參考文獻
[1]企業數字檔案館(室)建設指南(2017年)[E].國家檔案局網站
[2]張寧.電子文件真實性再認識[J].檔案學研究,2012(04):12-16.
[3]王秀華.電子檔案信息安全管理和技術措施[J].河北大學學報:哲社社會科學版,2002(02):87-90.
[4]李澤鋒.電子文件管理標準體系參考模型構建與實施[J].檔案管理,2010(03):24-26.