杜曉林
【摘要】大數據時代的到來,給檔案的管理工作帶來了新的難度與挑戰。本文從大數據時代檔案數據概念的轉變出發,并從“點”“面”“空間”“時空”四個維度著眼,探究大數據時代檔案數據的四維結構理論。
【關鍵詞】大數據;檔案數據;四維結構理論
每一次科技革命都會對檔案工作產生巨大的影響。工業時代的高效率讓檔案數量激增,迫使檔案管理更為系統化、科學化;信息時代計算機的普遍應用使電子文件的概念成為檔案管理工作必須面對的問題;而無論如何,2015年國務院下發的《國務院關于印發促進大數據發展行動綱要的通知》表明大數據時代已經到來,在大數據浪潮席卷下的檔案概念有了全新的變化。
一、大數據時代的檔案數據
全球知名咨詢公司麥肯錫(Mc Kinsey)是最早提出“大數據時代”已經到來的權威機構,該公司在2011年6月份的研究報告中明確指出大數據已經開始滲透到各行各業,逐漸成為各職能領域不可缺少的生產因素。不可否認的是,大數據時代的到來也對檔案學理論研究及檔案工作產生了很大的影響。就目前來說,我們一般所說的檔案,其通用的定義為:檔案是社會組織或個人在以往的實踐活動中直接形成的具有清晰、確定的原始記錄作用的固化信息。傳統的檔案管理方式采用了去粗取精的方法,將有用的、有價值的部分提取出來,而對于那些看似“無關緊要”的內容被排除在外,這樣的方式在一定程度上節約了人力物力,提高了管理效率,但也造成了一部分檔案數據的損失。
在大數據時代,檔案具有來源的豐富性、數據的冗余性、載體的多樣性和內容的混雜性等新的特征,數據與檔案間的概念區分越來越小,甚至可以寬泛地說:數據即檔案,可能單個數據沒有價值,但當它成為集合數據的一分子時,它的作用才能顯現出來,在此基礎上提取出的大量有價值的異構數據,成為我們所需的資源。因此,在大數據時代的引領下,檔案工作者亟須轉變思維,樹立起“數據即檔案”的大檔案觀,保證各類檔案數據的完整性與豐富性。
二、大數據時代檔案數據的四維結構理解
(一)第一維——“點”。檔案數據四維結構的第一維是結構中的“點”,其基本的構成要素是檔案數據。這里面的數據并非元數據,一般是指一個數字、一個名詞或是一張圖片等等。這是檔案數據的第一維,也是檔案數據的基礎,以下各維的構成都由檔案數據為基礎進行的。將檔案數據作為基本單位進行理解更具有靈活性,每個檔案數據都兼具兩種特點:一是作為信息主體,另一個則是信息背景。檔案數據的不斷累積,這些數據根據來源組合可以成為檔案信息。
(二)第二維——“面”。檔案數據四維結構的第二維是檔案中的“面”,其基本構成要素是檔案信息。這里的檔案信息是由檔案數據與檔案背景組成的,數據轉化為信息被接受者接收的必要條件就是對背景的解讀。同一來源的檔案數據中必然存在可以互為背景的檔案數據,通過對于背景的解讀,檔案數據就能成為具有利用價值的檔案信息。
(三)第三維——“空間”。檔案數據四維結構的第三維是檔案中的“空間”,其基本構成要素是檔案知識。檔案知識是人類在實踐中認識客觀世界的成果。它包括事實、信息的描述或在教育和實踐中獲得的技能。它可以是關于理論的,也可以是關于實踐的。檔案知識是檔案信息在空間上的延展,統一來源具有一定相似性的檔案信息整合在一起。知識的傳輸過程是傳輸者將其知識轉換為數據,數據通過一定的方式被利用者接受,然后對接收到的數據和背景重新整合成為信息,接受者根據自己的理解與推理能力重新加工成知識的過程。從這個傳輸過程中能看出接受者的能力在知識的接受過程中起決定性作用,經過人的提煉推理信息才有可能成為知識,所以檔案知識是檔案信息加上利用者的個人經驗組合而成的。
(四)第四維——“時空”。檔案數據四維結構的第四維是檔案中的“時空”,其基本構成要素是數據化的檔案館。檔案數據的第四維已經是檔案數據在時間與空間上的匯集了,此時的檔案數據已經在時間與空間上進行延伸,是對于四方上下與古往今來分布的檔案信息進行整合推理的過程。而檔案數據在經過四維結構中的第四維整合后,為直接面向公眾服務提供了支持工具,服務方式也更為多樣化,使檔案工作向精品化、個性化、智能化的服務方向發展。
三、檔案數據四維結構理論對檔案工作的指導意義
在大數據時代,檔案管理工作被賦予了新的形式與內容,檔案數據的量化進程將大大加快,檔案數據四維結構間的各個維度,即“點”“面”“空間”“時空”間的聯系將更加緊密與靈活,并且各個維度間的轉換速度得到有效提升,檔案信息流通程度變強,檔案利用效率變高,對檔案存儲系統也提出了更高的要求。但與此同時,檔案數據源的真實可靠性遭受質疑,檔案數據的安全性、保密性受到嚴峻挑戰,這也成為我們必須面對的問題。不過,毋庸置疑的是,大數據時代的發展必將引領檔案工作實現跨越式發展,更好地為需求者提供服務。
【參考文獻】
[1]馮惠玲,張輯哲.檔案學概論[M].北京:中國人民大學出版社,2006.