廖桂芹
中共婁底市委黨校,湖南 婁底 417000
當今社會科技日新月異,大數據技術迅猛發展,對我國各行各業都產生了深遠影響,檔案學在大數據背景下面臨著前所未有的機遇和挑戰。檔案科學具有大量性、增長性、多樣性等特點,與“大數據”技術的優勢不謀而合。檔案科學當以此為契機,創新理論、升級技術、轉變思維,推動檔案科學的進一步發展。
大數據技術利用全新處理模式對大量數據快速處理,可發掘出海量數據背后的有價值信息。檔案作為記錄社會科技、工業、軍事、農業、人文社科等各行各業的海量數據資源庫,迫切需要利用大數據技術對這些數據進行一定處理,發掘出對我國社會發展有用的高價值信息,但大數據背景下我國檔案學的發展還存在一些客觀問題。
(一)傳統檔案記錄方式與當下大數據技術不匹配,傳統檔案一開始以紙質記錄方式為主,隨著計算機技術的革新,逐步發展為電子文檔記錄和數字化記錄,最后發展為今天基于互聯網技術的大數據時代[1]。要實現檔案的大數據處理,首先面臨的問題是,如何將傳統紙質檔案、電子檔案和數字文檔中存在的一些非結構化或者半結構化信息數據重新編撰存儲,以達到大數據處理的基本要求。如海量數據資源間需要存在一定的關聯或者組合才能通過大數據技術得到有價值信息,而部分傳統檔案數據存儲模式不符合大數據技術所要求的的關聯或者組合方式。
(二)傳統檔案資源轉化率與大數據要求存在沖突,受當前檔案管理機制,存儲容量限度和管理成本等因素影響,傳統檔案對所記錄信息的實際價值有一定要求。檔案記載是有選擇性的將發生的“大事”歸入檔案,對從檔案學角度來說低價值信息只進行簡單記錄或者不予記錄,并且對于低價值檔案一般還會設置保存年限,到期后進行批量銷毀。而大數據技術的特點是從看似無用的海量低價值信息中,通過數據處理挖掘出高價值信息。這就與傳統檔案中的“價值”要求出現沖突,因為按照傳統檔案學中的價值要求,大數據分析所需要的海量數據中有一部分是無價值的。如果將大數據所需海量數據全部存儲,必定會導致檔案管理成本增加,但如果不存,則無法對大數據挖掘出的高價值信息形成有力支撐。所以,海量信息的存儲問題是傳統檔案與大數據技術結合所面臨的的一個巨大問題[2]。
(三)傳統檔案與大數據結合所面臨的法律問題。政府部門中涉及到國家安全的檔案信息,企業中涉及到企業產品核心技術的檔案信息,還有個人檔案信息中的隱私問題等,都不允許被大數據技術隨便利用,我國還缺少如何在保護數據安全和隱私的前提下利用大數據的相關法律法規。
(一)積極轉變思維模式,變被動提供為主動參與[3]。當前我國檔案管理基本處于被動服務的觀念,具體說來就是等待用戶上門提出具體需求,然后根據其需求提供檔案信息服務,用戶對檔案信息的獲取方式受到很大限制。在當前大數據技術應用越來越廣的背景下,我國檔案管理應積極轉變思維模式,變被動參與為主動出擊,充分利用大數據的技術優勢,對檔案中的碎片化信息進行有效整理和分析,形成量化數據,并將可以公開的信息主動共享給用戶,提高檔案信息的社會價值。同時檔案管理還可以為用戶提供個性化訂制服務,根據用戶的需求,將用戶所需檔案信息進行大數據處理,為其判斷提供參考。
(二)加快傳統檔案信息數字化轉換,提高資源利用率。雖然我國已經對傳統檔案進行了大量數字化建設,但目前仍存在未數字化轉換的檔案信息,需進一步加快相關工作的推進。由于與載體不可分離的原因,同一檔案可能同時存在于多個檔案存儲單位,在數字化建設過程中容易產生重復,加重了計算機存儲負擔。所以需對除服部分進行合理查重,降低檔案數字化建設過程中重復率的出現,提高服務器存儲資源的利用率。
(三)利用互聯網,推進檔案信息云共享。云計算是大數據技術處理海量數據的基礎,我國各地區均建有本地檔案庫,傳統檔案存儲方式要實現地區間檔案信息的互換和共享存在一定困難。可考慮通過云共享技術,將各地區甚至全國的檔案通過互聯網連接在一起,實現全國檔案信息的資源共享和交換,為大數據技術的實施提供數據支撐。
(四)加快推進大數據背景下檔案管理的立法工作,大數據技術發掘出高價值信息的基礎是基于海量數據資源,國家及企業機密,個人隱私信息等越來越受到重視,積極推進相關立法工作,為檔案大數據化工作提供必要的法律規范勢在必行。
大數據技術作為一種全新的數據處理模式,在人們日常生活中扮演著越來越重要的角色。大數據技術的快速發展為我國檔案學數字化建設帶來無限機遇,我們要在檔案管理工作中進一步轉變思維,創新工作方法,合理利用大數據技術,充分發掘檔案信息中潛在的高價值信息,創造出更大的社會效益。