馮華
摘要:利用大數據,對海量檔案進行科學歸集和利用,是當前檔案管理工作的重中之重。
關鍵詞:大數據 檔案管理 信息化
伴隨著我國信息化進程的快速發展,大數據已無聲無息地潛入到各行各業,網絡化、平臺化的新型企業組織模式正在極大挖掘管理的智慧和潛能。如何搶占管理制高點,利用大數據,對海量檔案進行科學歸集和利用,是當前檔案管理工作的重中之重。
一、正確認識大數據
1.大數據是社會發展高科技的產物。現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。牛津大學網絡學院互聯網研究所舍恩伯格教授認為,大數據是人們獲得新的知識、創造新的價值的源泉;大數據還是改變市場、組織機構和關系結構的工具。我們也可以將它定義為記錄人類社會活動的、具有規模效應的數據集合。
2.大數據的特性和原理。大數據有數據量巨大,數據種類繁多,價值密度相對低,處理速度特別快的特點,也具有規模性、多樣性以及高速性的特性;大數據的原理是運用云計算處理和其數據庫、云存儲、虛擬化的主要技術手段,對海量數據開展數據挖掘,從而快速獲得有價值的信息。其核心價值在于對海量數據進行存儲和分析。
3.大數據已融入社會發展各個領域。隨著互聯網信息化技術時代廣泛應用,大數據也吸引了越來越多的關注。大數據因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百甚至數千的電腦分配工作。在現今的社會,大數據的應用越來越彰顯它的優勢,它占領的領域也越來越大,電子商務、O2O、物流配送等,各種利用大數據進行發展的領域正在協助企業不斷地發展新業務、創新運營模式。大數據技術能夠通過海量、動態數據的有效集成,推動社會治理的精細化和科學化進程,并有效節約社會治理的成本。
二、大數據與檔案
1.從檔案概念看大數據。《檔案法》規定:檔案是指過去和現在的國家機構、社會組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。單從檔案的定義來看,除電子檔案外,其他載體形式的檔案與大數據沒有任何關系,只有檔案記錄的信息可以稱之為數據。
2.從檔案特性看大數據。從檔案的特征來分析,檔案具有社會性、歷史性、確定性及原始記錄性。而大數據也具有類似的特征,大數據也是人類社會活動的原始記錄,其內容也具有確定性,且其記錄的內容只反映事物已經完成的狀態,同樣具有原始記錄性。因此,檔案與大數據的關系僅是具有相似的特征,大數據是具有鮮明檔案特性的數據集合。
3.從檔案價值看大數據。從數據的保存價值來講,有些數據集合對國家和社會沒有永久的保存價值,不需要永久保存。而檔案本身的價值在于歷史性和記錄性,如何借助信息化手段,將有形的檔案轉換為數據,將電子檔案歸集利用好大數據,使檔案的保存價值得以放大,這是檔案今后發展與大數據的真正關系所在。
三、大數據給檔案管理帶來的機遇
1.實現挖掘檔案的價值的最大化。隨著當前檔案數字化進程的推進,檔案信息數量越來越龐大,面對海量的檔案信息,利用大數據技術可以快速地篩選出有價值的檔案信息,不僅實現了人力、物力和財務的節約,而且為檔案信息的開發利用提供了全新的思路。同時還能夠利用大數據技術對檔案信息進行深度挖掘,更好地發揮出檔案信息的重要價值。
2.實現共享檔案信息資源的最大化。基于大數據技術支撐下可以有效地促進檔案信息資源的利用和共享,在實際工作中,通過利用云存儲技術將有用的檔案信息在云平臺上進行存儲,構建云檔案系統,可以為檔案利用者提供更為便捷的檔案信息服務。云存儲不僅能夠為檔案信息資源共享提供更多的便利,而且還能夠有效地節約檔案信息開發利用的時間和存儲成本。通過將檔案信息錄入到數據庫中,用戶在查詢檔案信息時只需要輸入關鍵詞即可獲取到自己需要的檔案信息,不受時間和空間的限制。
3.實現檔案管理變革的最大化。在當前大數據時代,傳統的檔案管理方式越來越無法滿足電子檔案發展的需求。特別是大數據特有的碎片化、及時性和非結構化的特點,這也迫切要求檔案工作要加快自身的變革,摒棄落后的管理模式,加快推進檔案工作的升級,特別是要重視檔案信息挖掘技術和檢索技術的應用,提高檔案管理的智能化水平,放大檔案的價值。
四、大數據給檔案管理帶來的挑戰
1.大數據時代,從事檔案管理工作的人員管理的理念相對落后,大多數人員還存在著“重管理、輕利用”的理念,嚴重缺乏先進的工作思路和專業的知識體系,對掌握現代化信息手段和大數據應用技術不積極、不主動,部分檔案系統員工老齡化現象嚴重,不能適應全新的檔案管理模式,不能適應信息化技術帶來的挑戰。
2.對檔案資源管理的挑戰。隨著大數據時代來臨,傳統檔案管理工作已無法適應原始數據處理,檔案存儲能力和檢索能力受到嚴峻挑戰。尤其是從實體檔案到檔案數字化、數據化,檔案信息資源呈指數型增長,管理手段和工具已難以滿足大數據時代檔案信息資源管理的需求。目前歸檔內容龐大、檔案信息泛濫,這種環境下實現檔案數據的真實性、完整性、可用性和安全性,并在海量數據中實現對檔案信息的挖掘分析,從而提供有價值的信息,是檔案管理面臨的新挑戰。
3.數據資源安全性是檔案管理工作當中的一項重要內容,檔案涉及大量的黨和國家秘密、企業商業秘密和個人隱私。隨著檔案信息化程度的越來越高,現代技術應用的同時,致使檔案更容易受到網絡病毒、黑客的攻擊,造成信息丟失、泄漏或者篡改的后果,很難保證檔案的保密性。在檔案的提取利用中,容易被非法盜取、復制、修改或者偽造等,影響檔案的真實性、合法性。
4.大數據時代,檔案管理對信息技術的應用已是現實,現代化檔案管理人離不開掌握先進的信息化技術,需要既懂信息化技術又懂檔案管理專業的人才進行實際操作。但當前我國檔案管理數據分析類人才相對較少,制約了檔案管理工作發展。根據現有人員隊伍現狀,相應的人員素質急需提升檔案數據分析、操作和應用的能力,來適應檔案管理信息化的應用。