梁杰
摘 ?要:大數據時代的來臨給企業數字檔案館建設帶來了很大挑戰,本文通過對大數據的概念和特征的簡單介紹,分析了大數據對企業數字檔案館建設帶來的影響,并針對影響提出了相關的應對策略。
關鍵詞:大數據;數字檔案館;知識管理
引言
隨著互聯網技術的飛速發展,特別是物聯網、社交網絡和云計算的興起,全球數據量急劇增長,數據種類也越來越多樣化,各種非結構化和半結構化數據大量涌現,數據資源已經成為了當今社會增長最快的資源之一。根據國際數據公司IDC 監測統計,人類產生的數據量正在呈指數級增長,大約每兩年翻一番,并且這個速度在一段時間內會繼續保持下去。海量、多源異構的數據給企業管理和發展帶了很大挑戰,在傳統的數據存儲、分析、挖掘技術難以實時處理大量非結構化信息的情況下,大數據的概念應運而生。
1.大數據的概念與特征
大數據是一個比較抽象的概念,在信息科學領域至今尚無確切、統一的定義,在維基百科中對大數據如此定義:大數據是指利用常用軟件工具來獲取、管理和處理數據所消耗時間超過可容忍時間的數據集。這是一個模糊性的定義,因為它對常用軟件和可容忍時間的范圍并未明確界定。研究機構Gartner也對大數據進行了定義:大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量的、高增長率和多樣化的信息資產。這是一個描述性的定義,在數據處理的基礎上加入此類數據的一些特征,并用這些特征描述大數據。總的來說,盡管各方對大數據的表述不一,但其內涵一致,從本質上來說,大數據主要解決的是海量數據存儲、計算、挖掘和展示的問題。
國內外學者經過多年的研究,目前,盡管對大數據的定義尚有分歧但對于大數據的特征已經達成了共識:數據規模大(Volume),數據種類多(Variety),處理速度快(Velocity),數據價值密度低(Value),稱之為四“V”特性。
2.大數據對企業數字檔案館建設的影響
由于大數據具有數據量巨大、數據類型繁多、價值密度低和處理速度快的四“V”特點,因此大數據不僅對企業信息化工作帶來了新的挑戰,也對數字檔案館建設與發展產生了很大的影響。
2.1檔案大數據的獲取
在信息化高速發展的今天,檔案信息資源也呈現出復雜性和多樣性的特點,從技術實施的角度來看,檔案大數據可以從兩個維度來考慮:數據結構類型和實效性。從數據結構類型上分析,要同時支持結構化數據(來源于關系數據庫)、半結構化數據(來源于格式化文件如XML)、非結構化數據(電子照片、音頻文件和視頻文件等)。2019年12月26日,我國最高人民法院公布了《最高人民法院關于修改<關于民事訴訟證據的若干規定>的決定》,該決定第四十條規定,電子數據包括網頁、博客、微博客等網絡平臺發布的信息;手機短信、電子郵件、即時通信、通訊群組等網絡應服務的通訊信息都可以作為正式打官司的證據,進一步說明了檔案資源的數據類型與獲取渠道將日益廣泛化。從實效性的維度分析,由于大數據反映的是一種趨勢,通過數據量的變化推斷出事件發生的概率,數據量越大概率也會越準確,因此單一數據的時效性和價值將會逐漸弱化。
2.2檔案大數據的應用
知識管理是檔案管理發展的趨勢,檔案用戶已不滿足于數據或文件的查詢利用,更希望獲取數據背景后的信息和蘊藏的知識,這就對檔案大數據的應用提出了更高的要求。因此,檔案大數據的應用,應該從源頭進行規劃,建立一套邏輯結構元數據和檔案業務元數據系統來進行數據的管理和維護,實現數據的關聯性分析、元數據查詢以及檔案數據治理等功能。此外,為了展現海量數據的查詢結果多樣性、多角度、多層次,檔案大數據需要應用數據可視化的相關技術,因為可視化技術是最佳的結果展示方式之一,通過清晰的圖形圖像可以直觀反映出最終結果。
2.3 數字檔案館云平臺建設
由于檔案數字資源龐大、種類繁多、結構復雜,不同的檔案數據中蘊含的價值差異很大,因此不可避免的會導致用戶獲取有價值信息的難度增大。數字檔案館云平臺就是解決這類問題的有效途徑,云平臺可以基于現有的IT基礎設施進行建設,也可以依托大數據專業機構提供的云服務。EMC存儲專家和資深產品經理李君鵬認為,大數據本身就是一個問題集,云技術是目前解決大數據問題集最有效的手段。
3.企業數字檔案館建設的策略
隨著大數據時代的到來,企業數字檔案館建設也將面臨新的挑戰,如何對大數據進行管理、儲存、信息挖掘和提供利用都將是亟待解決的問題,這就要求企業在建設數字檔案館的時候,要從整體進行規劃,結合企業實際需求和發展趨勢,確定功能定位,制定數字檔案館建設的策略,應對大數據可能對企業生產經營活動造成的影響。
3.1 加強數字檔案館頂層設計
企業數字檔案館建設是一個不斷完善和持續改進的過程,在推進過程中,檔案部門應當做好頂層規劃設計,充分考慮檔案工作的發展趨勢并論證方案的可行性,才能更好地推進數字檔案館建設。企業檔案部門應當根據數字檔案館系統建設、業務集成、數據共享及運行服務等需求,加快相關規范、制度和標準的出臺,使企業檔案工作有章可循。在制定規章制度時,應首先考慮采用國際標準,其次才是國家、行業以及地方標準,并盡可能采用適用范圍比較廣泛的標準。
3.2 ?提高企業檔案信息化設施水平
加大投入改善檔案軟、硬件設施水平。首先,優化配置各種資源,企業根據實際需要,為檔案管理部門配備必要的硬件設施,并隨著需求發展不斷升級完善,從長遠考慮為滿足數字檔案館建設的需要,逐步實現檔案云平臺建設目標。其次,立足于公司發展的需要,建立大數據采集系統,豐富信息資源體系。最后,為方便知識的利用,企業應以內部局域網為依托,采用標準的B/S(瀏覽器/服務器)模式,以數據庫技術為支撐,基于智能檢索技術和網絡技術,不斷優化檔案可視化技術,以滿足多樣化、個性化的利用需求。
3.3建立一支專業的檔案信息化人才隊伍
數字檔案館建設、應用與維護等工作與信息技術的發展有著非常緊密的聯系,這就決定了數字檔案館的運營模式有別于傳統實體檔案館,經營管理數字檔案館的工作團隊不僅要掌握檔案專業管理知識,還要擁有一定的信息技術水平,熟練掌握常用的計算機技術、網絡技術以及數據庫技術,能夠獨立承擔起數字檔案館日常運行和維護工作。這就需要企業建立一支專業的信息化人才隊伍,承擔起大數據時代下的企業數字檔案館建設和檔案信息化工作的重任。
4.結束語
建設數字檔案館是一項長期復雜的系統工程,其建設內容包括頂層架構設計、檔案數據資源的整合利用、檔案信息云平臺搭建、人才隊伍培養以及系統運行維護等多個方面。而大數據時代的到來,對企業數字檔案館建設提出了更高的要求,如何從海量數據中挖掘、分析有價值的信息并通過可視化的技術展現出來是亟待解決的問題。知識管理已經成為檔案管理的發展趨勢,企業建設數字檔案館的目的就是強化知識的有機聯系,通過強大而靈活的分布式檢索功能,保證檔案信息的高度共享,為企業發展提供多樣化的知識支撐。
參考文獻
[1] ?馬建光,姜巍.大數據的概念、特征及應用[J].國防科技,2013(2):10-13.
[2] ?薛四新,張曉.論數字檔案館的共建與共享[J].檔案學研究,2010(2):65-67.
[3] ?蘭祝剛,惠英,李剛.大數據時代下的檔案工作[J].中國檔案,2013(9):74-75.
[4] ?陶水龍,大數據時代下數字檔案館面臨的機遇與挑戰[J].中國檔案,2013(10):66-68.