摘 要:大數據是信息時代最鮮明的特點。隨著信息時代的到來,大數據技術已逐漸滲透到各行各業,檔案工作要取得長足的發展,必然也離不開大數據技術的支持和應用。本文從大數據技術入手,分析當前在檔案工作中大數據框架構建及應用措施。
關鍵詞:檔案工作 大數據 框架構建 應用
中圖分類號:G27 文獻標識碼:A 文章編號:1003-9082(2018)02-00-01
引言
在信息化時代,檔案工作已經成為了社會建設與發展的重要工程,并隨著科學技術的飛速發展,迎來了一個新的發展時期,而與此同時,信息時代大數據技術的逐漸廣泛應用也給傳統的檔案工作帶來了全新的挑戰和更大的發展壓力。因此,我們只有加強檔案工作與大數據技術的應用與融合,才能推動檔案工作快速發展,與時代同行。
一、大數據技術在檔案工作中應用的基礎
大數據是信息時代的產物。它是指一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合[1],而需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的信息資產。它具有規模巨大、流轉高速、類型多樣、價值密度低的特點。而信息時代的檔案也正好具備了這些特點,因此也具備了大數據在檔案工作中的應用基礎。
1.檔案數據量極大
我國地域遼闊,有著燦爛的歷史文化,產生了各種典籍和價值極高的歷史記錄,各地區檔案館所保存的檔案總量已然是一個龐大的數字。據了解,2011年,我國各級國家檔案館的檔案總數就已達3.3億卷,如果再加上各地市檔案館、各企事業單位儲存的檔案,這將是一個巨大的資源庫,也構成了一個巨大的檔案數據庫。
2.檔案數據價值密度低
無論是國家檔案館,還是地方檔案館,或是企事業單位檔案室,保存的檔案都是具有很高價值的資料,但由于個人利用需要的原因,相對于這些龐大的檔案信息量,每次利用的數據可能非常少。
3.檔案資源種類多樣,內容復雜
由于朝代更替,文化演進,科學變遷等因素形成了各種各樣的檔案資料和歷史典籍,同時隨著信息時代的到來,檔案的種類進一步擴大,出現了除文字檔案外的音頻、視頻、圖片、網頁等這些非結構化檔案。為了進一步加強這些結構化和非結構化的檔案保存和利用,迫切需要將這些檔案進行數字化處理,建立數據化資源庫,而大數據技術正好解決了這一難題。
4.社會對檔案工作的管理效率要求越來越高
信息化時代的到來,大大提高了人們的工作效率,產生的檔案也越來越多,人們保存、利用檔案的意識也越來越高,因此對檔案的收集、分析、整理、利用的速度要求也越來越高。現在雖然部分檔案工作已經智能化,但總體時效還不高,而大數據的處理方式剛好能克服這一缺欠,能高速地處理、分析各種檔案資源,為人們及時提供其所需的檔案數據。
二、檔案大數據框架構建及應用分析
1.全面實現檔案數字化,加強電子文件管理
全面實現檔案的數字化,加強電子文件建設工程,這是大數據框架構建及應用的首要前提。各級檔案館和企事業單位應大力開展檔案的數字化工作,盡可能將館藏檔案全部實現數字化,加強實施電子文件的收集和保管工作。雖然現在很多檔案館都在推進這項完成,但由于信息時代產生了大量非結構的檔案,給數字化工作帶來了一定的困難,而且我國檔案之多,要全面實現數字化,仍然是一個較艱巨的任務,需要較長一段時間。
2.搭建檔案大數據網絡平臺,實現檔案資源共享
搭建檔案大數據網絡平臺是推動檔案管理技術創新,順應大數據時代發展的必然措施。在信息社會,每天都會產生大量的數據,留存下來的數據很多,卻存放分散,檔案資源無法共享,這不僅造成了檔案資源的浪費,也無法滿足信息時代人們對檔案利用的更高要求。因為信息時代的工作是高效率的,人們對檔案的利用要求是全面的、及時的、精確的,能為利用者提供更強的決策力或洞察力的。而很明顯,傳統檔案管理平臺已經很難滿足信息時代人們對檔案的利用需求,迫切需要搭建一個檔案大數據網絡平臺,將檔案工作和大數據技術有效地結合起來,利用大數據技術基礎的云計算技術將全國或區域的檔案資源合理整合,深入處理分析,根據利用者的需求,為其提供精細,準確的,具有針對性檔案信息,從而提高檔案的利用率,實現檔案資源的共享。
3.建立檔案數據的準入和管理機制
由于現代社會人們越來越多地追求經濟利益,在這樣的情況之下,就難免出現一些為了利益而造假的現象,因此,必須要建立高質量、高價值的檔案資源庫,全面保障我國的檔案數據質量。相關管理部門應該進一步加強對數據檔案的管理,建立較高的數據準入標準,剔除較差和充數的數據資料,在檔案搜集過程中突出“質”,堅持隨時收集和定期收集、重點收集和普遍收集相結合的方式,對有價值的文件材料進行特殊整理、標記,還需要逐個對電子目錄進行檔案質量的檢查,以確保符合入檔的程序和要求,并進一步對電子檔案進行分類編目,層層把關來確保檔案質量[2],確保檔案大數據建設工作健康、順利發展。
4.加強人才培養,促進大數據技術的發展
自2016年以來,以阿里巴巴、華為、浪潮為代表的眾多大數據企業紛紛與各大高校達成合作協議,共同聯手打造出一批大數據技術相關人才以及大數據教育培訓基地,為大數據技術的發展提供了有效保障。我們可以利用這些有效資源,通過加強對現有檔案人員的大數據技術培訓工作和對大數據人才的招聘,為大數據技術在檔案中的應有奠定堅實的基礎。
結語
在大數據浪潮的引領下,我國各行業都開展了廣泛的大數據技術研究,檔案管理工作的數據化趨勢已經是不可避免。因此,檔案部門要著眼于大數據時代檔案工作的發展需要,積極與信息化部門展開合作,制訂大數據背景下的檔案工作管理機制,學習先進的大數據處理技術,為大數據時代的檔案管理打好基礎。
參考文獻
[1]維克托·邁爾?舍恩伯格、肯尼思·庫克耶.大數據時代[M].浙江人民出版社,2013.
[2]林文敏.云環境下大數據服務及其關鍵技術研究[D].南京大學,2015.
作者簡介:李春玲(1983.10-),女,廣東省電白區,學歷:本科,畢業于湖南科技學院;現有職稱:;研究方向:檔案管理。