文/南寧市防汛抗旱物資儲備中心 鄭偉良
大數據環境下,全國檔案信息化建設不斷推進,檔案管理與利用的方式呈現出明顯的數字化、網絡化和自動化趨勢。在理想的情況下,大數據技術的應用能夠集成大量的電子檔案,大大提高檔案管理的效率,同時也提供了便捷、快速的訪問服務,有利于檔案資源的共享與利用。近年來,我國對檔案信息化建設中涉及的信息安全問題高度重視,制定了多項政策,取得了一定成效,但互聯網環境、線上操作流程、檔案的可復制性等問題給檔案的風險治理帶來巨大的挑戰。特別是對于大數據這種新興技術來說,其推廣與應用需要一套完整的信息風險治理體系予以匹配。對此,檔案管理部門應準確把握大數據環境下檔案信息的內外部風險,進一步明晰大數據環境下檔案信息風險存在的原因及優化措施,為檔案工作的創新發展提供了良好條件。
大數據環境是指技術驅動社會、數據傳達信息的人文環境,在這個環境中,數據與人類的生活息息相關。大數據在檔案管理中的應用主要表現在三個方面:一是大數據理念擴展了檔案數據來源,突破了原有的內部產生、收集與管理的格局,原本在日常管理中的過程性數據和碎片化信息成為重要的數據來源之一。二是數據內容更加豐富,大數據技術的應用能夠進一步擴展數據存儲量,隨著收集數據種類的不斷增多,這一趨勢將愈加明顯,傳統實體檔案在大數據技術的應用下逐步開展數字化工作,這些移交和轉化都大大提高了數據存量。與此同時,檔案數據類型也在不斷增多,不僅包括傳統意義上成套檔案,過程性信息也逐漸成為檔案保管的對象。三是數據價值密度降低,檔案的形成要經過一系列嚴謹的收集、歸檔和價值鑒定,而大數據技術的應用會使得數據類型和規模急速增長,很多檔案長期以來無人利用,整體信息資源的價值密度逐漸降低。從大數據在檔案管理中的應用來看,其具有一般電子檔案所面臨的信息風險,也具有大數據技術特征下面臨的海量數據和多樣載體風險。下面從內部和外部兩個角度來分析大數據環境下檔案風險環境。
(一)外部風險。外部風險主要來自社會環境和自然環境兩個方面。社會環境中主要有三類直接作用于大數據環境下的檔案信息風險治理:一是政治環境。主要是指政府主導制定的關于檔案的政策、政府對檔案檔案管理要求的變化(如機構改革、智慧政務等)以及檔案管理部門提供服務能力的變化。二是法律法規環境。法律法規的頒布、修訂都會直接影響檔案信息風險的治理,如2021年11月1日開始施行的《個人信息保護法》對檔案風險治理中個人檔案部分提出更高要求,同時明確相關管理單位的法律責任。三是網絡安全環境。一般來說,新技術的應用都需要進行極限壓力測試,特別是大數據技術應用時,要考慮到組件或硬件被闖入的情況。如攻擊方可以嘗試以耗盡資源的方式使用系統,例如將隨機垃圾添加到存檔中或者撞庫攻擊電子檔案數據庫。當檔案緊密嵌入內容生產與管理環境中時,拒絕服務(DOS攻擊)會導致電子檔案停止服務。此外,被篡改的元數據會使檔案無法搜索,同時也直接導致檔案價值喪失。未經授權訪問內存高的內容(高分辨率視頻、圖片等)也很嚴重。自然環境方面面臨的風險通常是所有檔案管理中都會遇到的一些安全風險,包括對物理基礎設施和用戶本身的威脅,例如停電、自然災害、蟲咬、潮濕等情況。面對一般威脅情況,檔案管理部門應通過政策、制度、保險和教育等措施加強整個安全防護體系的抗風險能力。除上述的威脅外,大數據環境下電子檔案管理所依賴的通用組件(服務器和基礎設施)也存在一些威脅。
(二)內部風險。內部風險主要包括組織環境、技術環境和業務環境。組織環境中對信息風險治理較為重要的是組織架構和人力資源。組織架構具體體現在是否有專門負責檔案風險信息風險治理的部門,是否具有完善的信息安全管理制度等。而在人力資源方面,大數據應用及其風險治理對管理人員的信息素養要求較高,同時也需要有專業的信息技術人員提供技術支撐。此外,人力數量、業務能力、人員流失等因素也對會對檔案信息風險治理產生較大影響。技術環境中影響較大的是基礎設施、新技術應用和系統環境。在基礎設施方面,大數據環境要求開放的互聯網環境和強大的信息存儲能力,信息風險治理要實現對檔案的實時監控,也需要高速的帶寬和系統相應的能力,數據的增多也要求足夠的設備進行應急備份。在新技術應用方面,無論是大數據技術數據庫建設、人工智能下的自然語言處理和區塊鏈的智能合約,還是新技術應用后的后續維護、更新和保養以及檔案服務創新,都給檔案風險治理技術層面提出了更高要求;系統環境方面,大數據技術應用后可能產生的兼容性問題、互操作性以及后續的維護會引起信息風險治理的不確定性。業務環境中,大數據技術應用引起元數據管理的不確定性,包括數據管理中的規范性、保密性,數據挖掘于分析中對元數據的修改和關聯是否獲得授權等,都會威脅信息安全。另一方面,大數據環境下數據的海量增長會影響數字檔案資源的長期保存,過多價值密度低的檔案長期保存,會大大提高信息風險治理成本。
(一)檔案信息風險識別與評估工作滯后。大數據環境下,檔案信息風險治理涉及多個部門,但從檔案管理工作現狀來看,部分單位檔案信息安全保障工作較為孤立,處于各自為政的階段,沒有形成一個適應性強、普適性強的檔案信息安全保障體系,嚴重影響了信息風險治理的整體水平。其中最重要的一個原因就是沒有綜合運用各種元素對檔案面臨的信息安全風險進行評估,這就導致了各單位檔案信息安全管理工作的方向和目標不夠明確,造成本單位的信息安全管理工作的針對性不強。同時,檔案信息風險識別的方法也較為單一,對信息技術的依賴性較大,沒有從管理流程和業務的角度對信息風險治理工作進行評估。
(二)缺乏強有力的技術支撐。一是基礎設施建設滯后。大數據環境下,檔案信息風險治理不僅包括前期的基礎投入,也要在后續進行維護、更新和保養,這比傳統檔案信息風險治理要求具備更高的軟硬件水平。傳統檔案信息風險治理具有較為明顯的周期性特征,實時性不足,大數據環境則要求了實時數據運算、大批量數據存儲,因此在硬件、軟件、系統研發單位二次開發的費用投入方面,比常規實體檔案管理的費用要大得多。但目前,由于經費上的限制以及思想上的不重視,部門在檔案信息風險治理上的硬件投入明顯不足,存在著一定的安全隱患。二是技術能力不足。大數據環境下,電子檔案的內容生產與管理環境、歸檔材料的完整性(包括元數據在內)以及知識產權面臨的安全威脅更加多樣。一般來說,新技術的應用都需要進行極限壓力測試,特別是大數據和區塊鏈技術應用時,要考慮到組件或硬件被闖入的情況。但目前部分地區檔案信息風險治理方面的技術較為原始,只能應對一般的病毒和系統漏洞,對撞庫、脫庫等惡意攻擊的方法和能力不夠。
(三)檔案信息風險治理制度不完善,機制不順暢。一是管理制度不完善。大數據環境下檔案信息風險治理對管理系統和互聯網的依賴更大,但目前還鮮有關于信息風險治理方案的專門制度設計,相關內容也不具體。同時,由于大數據環境下數字檔案載體的標準和規范缺乏統一,海量的數據和多樣的載體會導致部門檔案的元數據著錄不全面,容易產生檔案缺失的管理風險。二是治理機制不順暢。檔案工作的特殊性決定了檔案通常是依托行政管理體系開展的,這導致檔案管理部門、內部職能部門和外部相關部門無法形成有效的溝通機制。在信息風險治理方面存在多頭管理的情況,責任邊界模糊,責任性事故定位不明確。這也導致很多部門缺乏檔案信息風險管理意識,使檔案信息安全工作面臨嚴重的安全風險隱患。三是信息風險治理缺乏持續性。大數據環境的檔案工作是持續性和常態化的管理與服務,因此對信息風險治理也提出了較高的要求。由于信息安全問題的突發性和不確定性,對于未發生信息安全事件的單位來說,信息安全保護的成效和價值無法在短期內顯現出來,這導致多數單位在平時放松了信息安全管理,當發生信息安全事件時,才開始進行緊急搶救。
(一)健全大數據環境下檔案信息風險管理。健全大數據環境下檔案信息風險管理主要包含三個環節:一是風險識別。進一步明確大數據環境下信息風險識別的內容,圍繞共性的外部風險和基于業務特征的內部風險,逐步完善風險管理的內容。一般來說,識別內容中較為復雜的是大數據環境下的技術風險,主要有四類:1.闖入組件。在考慮到組件或硬件被闖入的情況時,應假設攻擊者獲得了對目標組件的完全訪問權限。2.欺騙組件。是指當攻擊者欺騙一個組件時,他通過用自己的組件替換該組件來模仿存檔中組件的行為。3.闖入通信。我們將這種威脅分為兩種類型:未經授權的信息讀取訪問;改變或攔截組件之間的流量從而導致丟失或者損壞電子檔案的行為發生。4.使用威脅。用戶可以嘗試以耗盡資源的方式使用系統,例如將隨機垃圾添加到存檔中或者采取撞庫攻擊電子檔案數據庫。二是選擇合適的風險識別方法。考慮到大數據環境下檔案管理的信息化和開放化特征,風險識別應采用專家咨詢法、系統識別法和調查法相結合的方式。其中,專家咨詢法要覆蓋檔案業務領域的專家和信息安全專家,系統識別法則需要管理部門基于大數據的特征在前期就布置相應的軟硬件予以識別。三是風險識別后的應對。具體而言,可以根據業務特點構建信息安全網絡模型。如美國網絡安全領域常用的PDRR模型,即防護(P:Protection)、檢測(D:Detection)、恢復(R:Recovery)和響應(R:Reaction)四部分,以強化各個環節的風險識別與應對。
第一,強化信息風險治理技術保障。加強信息風險治理的需求調研。內部由檔案管理部門和涉及檔案流轉的職能部門對大數據環境下的信息風險治理現狀進行分析,遵循差異化、層次化的原則,同時也要考慮到信息技術更新迭代可能帶來的新的安全問題,采用量化評價的方式對信息風險治理技術的應用及成效進行預測,為后續新技術的部署和應用提供參考。第二,確保基礎設施投入。基于需求調研加大對最底層和最緊迫檔案信息風險治理應用的投入,尤其是服務器與存儲設備。同時,推動各類數據與管理平臺共享共建,進一步完善檔案資源易地備份模式,定時更新計算機終端的系統和殺毒軟件,防止木馬病毒和利用系統漏洞侵入計算機設備。第三,加強數據庫安全防護。主要針對大數據環境下線上操作系統中的檔案編輯工作站、元數據數據庫、密鑰數據庫、規則數據庫和高分辨率電子檔案存儲等核心環節進行防護,其工作重點包括兩個方面:一是防止數據的丟失和損毀,針對此類問題主要采用數據備份技術。對電子檔案的數據備份應采用異地備份的方式,當下較為主流的是采用云存儲,確保數據的永久保存;二是防止數據被竊取。在上述的風險識別與應對中,除一般的檔案編輯工作站,其余所有數據庫中的數據都處于加密狀態。因此對電子檔案編輯工作應采用全面的數據標記,確保數據在可控范圍內。其他環節則要嚴格執行加密和解密流程,讓攻擊者無法識別有價值的信息。
(二)完善檔案信息風險治理體制機制。第一是完善檔案信息風險治理的制度建設。具體而言,是針對大數據環境下檔案信息風險的不同領域做好制度的細化。如個人檔案所涉及的信息安全泄露問題,檔案轉接過程中的損毀與丟失問題,科技檔案服務中知識產權問題,教學檔案服務中學生隱私的保護等。同時,還要考慮到大數據環境下檔案數量激增、管理條目增多和數據類型更加復雜的情況,由相關職能部門參與制訂具體領域管理制度,避免出現“管理空白”和“制度空白”。第二是強化檔案信息風險治理過程中的問責制度。問責制度的關鍵在于對風險治理中“不作為”或重大失誤進行懲戒,在完善制度的同時,能夠提高管理人員的責任意識。同時,政府層面應完善對檔案轉接過程中的企業等第三方機構的問責制度。特別是針對瀏覽器、管理信息系統中的數據收集以及過度授權問題制訂嚴格規定,對產生重大信息安全疏漏或導致個人信息泄露等問題的,依法追究其民事責任和刑事責任。第三是建立健全監管機制。首先,健全內部監管機制,根據大數據環境下檔案信息風險治理的重點、痛點和難點建立考核體系,定期考察工作推進情況。其次,由單位內部的紀檢部門牽頭對檔案信息風險治理進行巡查,持續追蹤其整改情況。在外部監管方面,由政府牽頭,動員社會和民眾的力量,對檔案信息風險治理情況進行監督,逐步搭建起互相監督機制,有效保障檔案信息風險治理的持續推進。