郭雪萍
摘要:本文在概述大數據的特點、原理與流程的基礎上,分析了大數據給檔案管理帶來的機遇與挑戰,重點提出了大數據時代檔案管理的應對策略。
Abstract: On the basis of summarizing the characteristics, principles and processes of big data, this article analyzes the opportunities and challenges brought by big data to archive management, and puts forward the strategies for archive management in the era of big data.
關鍵詞:大數據;檔案管理;機遇;挑戰
1 大數據概述
1.1 大數據的特點
大數據主要有四個方面特點:一是數據量巨大,二是數據的種類繁多,三是價值密度相對低,四是處理速度特別的快。概括起來即為四個“V”:大量(Volume)、多樣(Variety)、價值(Value)、高速(Velocity)。
1.2 大數據的原理與流程
大數據的原理是運用云計算處理和其數據庫、云存儲、虛擬化的主要技術手段,對海量數據開展數據挖掘,從而快速獲得有價值的信息。其核心價值在于對海量數據進行存儲和分析。
大數據涉及的流程包括:
①數據采集:采用多個數據庫來接收來自數據采集終端的數據。
②導入處理:將數據采集終端的數據導入到一個集中的大型分布式數據庫或者分布式存儲集群,每秒導入量一般達百兆甚至千兆以上。
③統計分析:用分布式數據庫,或分布式集群對存儲其內的海量數據進行統計分析后進行分類匯總。
④數據挖掘:是通過在數據中進行不同算法的計算,從而獲得新的信息,可以實現特定功能與定義的數據分析。
2? 大數據下檔案管理的機遇與挑戰
海量數據歸檔,使檔案工作從實體管理上升到知識管理;同時,檔案數據庫的使用極大地提高了檔案利用效率,可有效解決常規檔案管理極易出現的“脹庫”現狀,利用大數據技術可構建檔案館的新型知識服務引擎。這給檔案工作提供了良好的發展機遇,同時也給檔案工作帶來了巨大挑戰。
2.1 機遇
大數據改變了檔案管理思維,如今,檔案大都以全電子時代的載體形式來存儲和利用,紙質和其他實體檔案越來越少,海量的電子檔案來源于大數據,大數據平臺推動了檔案管理。從海量數據中發掘出價值信息,并能夠將檔案資源轉化為知識資源,成了檔案工作者的新任務。而基于大數據的數據分析和數據挖掘技術又是帶領檔案正式步入大數據時代的基石。將檔案工作原本的“默默無聞”推向了“業務先鋒”的新角色,這些都為檔案工作帶來了新的發展機遇。
2.2 挑戰
第一,檔案資源管理的挑戰。從實體檔案到檔案數字化、數據化,檔案信息資源呈指數型增長,管理手段和工具已經難以滿足大數據時代檔案信息資源管理的需求。當下,歸檔內容龐大、檔案信息泛濫,這種環境下實現檔案數據的真實性、完整性、可用性和安全性,并在海量數據中實現對檔案信息的挖掘分析,從而提供有價值的信息,是檔案管理面臨的新挑戰。
第二,檔案安全的挑戰。檔案涉及大量的黨和國家秘密、企業商業秘密和個人隱私。隨著檔案信息化程度的越來越高,致使檔案更容易受到網絡病毒、黑客的攻擊,很難保證檔案的保密性。在檔案的提取利用中,容易被非法盜取、復制、修改或者偽造等,影響檔案的真實性、合法性。
第三,檔案管理技術的挑戰。檔案管理技術無法滿足云計算下大數據應用的要求。檔案管理軟件的開發沒有統一的共性與標準,各系統之間無法進行數據的轉換,很難用同一個軟件進行檔案的統一管理。再是檔案管理體系較分散,管理體制與方式的統一很難實現。
3? 應對策略
3.1 強化檔案管理職能,提升人員素質
實現海量檔案資源數據和檔案應用系統的整合,開展檔案信息資源的有效配置,不斷發揮檔案集合效應,從而適應檔案資源利用共享的需要。縱向加強監督指導,打破“壁壘”,加強與其他職能部門溝通協調,尋求工作上相互支持配合,加強業務之間的聯合,實現優勢互補,充分開發利用,明確檔案信息資源整合的主體。
數據價值的關鍵是無限的再利用,發揮其潛在價值,這從技術層面對人才提出了較高要求,加強對檔案人員的能力培訓,使其具備信息化專業能力、專業知識分析能力及綜合管理素質等,才能使大數據下的檔案管理發揮最大效能。加強人才培訓,除了提高專業技能外,還應加強對人才的管理激勵,才能不斷吸納優秀的管理團隊。一應注重專業崗位的動態管理,讓人才和崗位匹配;二要創建人才服務平臺,為吸收引進優秀專業人才創造條件。
3.2 理順檔案工作體制,統一檔案標準規范
在遵循“統一領導,分級管理”的原則下,切實履行檔案事業行政管理部門的行政職能,以加強檔案館/室建設為基礎,突出檔案館在我國檔案事業發展中的基礎地位,制定和完善檔案管理標準制度。
企業應以《中華人民共和國檔案法》、十號令等相關法律法規為基礎,加強對檔案管理制度的完善和強化,保證檔案管理制度能夠符合國家相關要求,確保檔案管理制度能夠達到國家標準。在我國,檔案工作的內容、手段和水平日趨完善,這對促進國家經濟社會的發展做出了重要貢獻。盡管如此,檔案服務工作規范制度的缺失,讓各檔案館及檔案管理者更多的是憑著工作責任感,加上自身對業務的理解,經驗性地開展檔案服務工作。統一管理規范的缺失,使檔案管理工作缺乏科學的引導與規范,阻礙了當前環境需求下檔案館管理水平的進一步提升,因此,在新時期制定統一的檔案管理服務規范對于全面提升檔案機構服務能力具有積極的作用。檔案管理制度應由企業內部對其制定有效的、科學的企業檔案管理制度,比如針對企業在生產以及服務方而的要求不同,與企業的各個部門的責任人以及企業的檔案資料管理人員對企業檔案管理的相關制度與注意事項進行相應的討論,形成企業檔案管理辦法,并通過試用與針對性改進逐步進行完善。通過這些措施,滿足企業的發展任務的需求,讓檔案管理工作符合企業的發展需求。
3.3 升級檔案管理系統,加強電子文件歸檔
現有檔案管理系統多數是基于單機或局域網建立的,為適應大數據時代的發展趨勢,需要對現有檔案管理系統進行升級,以實現基于云計算的大數據檔案管理。而隨著大數據的來臨,大數據檔案管理平臺也順勢而生,其依托各行業不同網絡環境下構建的海量存儲,進行計算和管理,并能夠自動調取利用,具備多樣性、可擴展性、經濟性、可定制性等特點,加大對中小微企業在檔案管理工作中的服務,也可以構建方便靈活的具有大容量的智能數據平臺,滿足個人服務。
在大數據時代下,電子文件來源日益復雜,種類繁多,企業產出的電子文件越來越多,電子文件歸檔與保存的具體要求,直接影響了文件的歸檔過程。隨著計算機系統不斷更新換代,技術的不斷革新,電子文件的歸檔常需要更改載體且需頻繁更改,保證電子文件的長久保存與利用,有著技術和標準運用上難題,尤其是對于專業軟件形成的特殊文件。當前環境下,因為各機構、組織存在不同程度的電子文件管理方法不科學、歸檔方法不恰當、管理系統功能不完善、管理制度不健全等問題,直接影響著信息資源的整合與利用,威脅著電子文件檔案信息的長期留存、有效收集,給歸檔管理電子文件帶來了嚴重隱患和風險。因此,應使電子文件歸檔的各個環節加強,從而保證電子檔案信息的有效性、準確性、可利用性、可靠性等。
3.4 優化檔案館藏結構,實行資源整合
檔案管理的綜合能力,主要體現在以下幾個方面:一是在對檔案資料的占有程度上;二是確立檔案工作的主體地位上,能否對各級各部門的檔案信息能夠實行有效的調配和管理;三是在系統性檔案資料的研究開發方法手段和前沿水平上。為適應大數據時代檔案管理發展趨勢,有必要進行檔案資源的整合,將各級各部門的有保存價值的檔案信息做到由分散到集中、由無序到有序,為適應新形勢下各級各部門對檔案館服務功能的要求,通過對檔案資源的整理、組合和合理分工,使檔案機構和檔案資源結構合理、配置優化,進而提升服務功能、形成服務體系。一方面按照能夠最大限度地對全員開放和提供優質服務的要求進行檔案資源的優化配備和整理加工,另一方面要完善各級檔案館實現基本功能的基礎條件,將分散在各個部門檔案資源進行集中。通過對檔案資源的有效整合,才能真正的把檔案館及檔案機構建成能夠向各級各部門提供及時、有效的信息利用中心和檔案資源服務中心。
3.5 深化檔案加工處理,開展檔案知識服務
在大數據時代,檔案管理部門除了傳統的檔案接收、整理與發放等被動職能外,還應進行大量的檔案加工處理,開展檔案知識服務等主動管理服務。檔案管理部門在收集到海量檔案數據后,可通過開展對檔案借閱者的深入了解,開展利用需求分析,建立相關數據模型,提高檔案價值,進而對海量數據進行項目分類、相關性分析,從而推算出數據之間的關系,將積累的檔案變成有用的信息情報,讓“檔案數據庫”變成“戰略論證庫”,為檔案利用者提供有價值的知識服務,為科學決策提供參考。
3.6 實施檔案風險管理,確保安全的檔案信息
大數據應用的最大風險,是檔案數據安全管理問題。海量數據盡管集中存儲,方便了數據分析和處理,但這種環境下,數據的安全管理、數據的管理備份不當等,很容易造成數據的永久丟失和損壞,這一風險對檔案來說,將是毀滅性的災難。大數據時代的檔案風險管理需要做好以下幾個方面:
一是數據保護。由于大數據采用云計算的方式進行,這種服務方式使用戶失去了對物理資源的直接控制,從而導致檔案數據在不知情的情況下可能被竊,因此,在建立大數據檔案管理的同時,需要建立有效的安全機制,盡量減少數據失竊的幾率。
二是數據備份。建立合理有效的數據備份與歸檔機制,確保檔案數據在安全機制失效導致數據丟失或損壞的情況下,可通過備份或歸檔的數據快速實現數據恢復,避免大數據檔案發生毀滅性的災難。
4? 結束語
大數據技術對檔案資源開發利用將會產生巨大的貢獻與影響,促使檔案管理系統功能的強化與完善,可對企業各類信息資源和知識資產進行管理,充分實現檔案的知識價值,實現大數據時代到知識管理的跨越,可大大提升企業的核心競爭力,也可以提高檔案工作的地位與作用。
參考文獻:
[1]徐擁軍.企業檔案知識管理模式——基于雙向視角的研究[J].檔案學通訊,2007(5):50-53.
[2]劉艷英.試談檔案信息化管理[J].蘭臺內外,2013(3):55-55.
[3]陳傳義.檔案信息網站構建基礎與實例[J].檔案學通訊,2012(4):49-50.
[4]蘭祝剛,惠英,李剛.大數據時代下的檔案工作[J].中國檔案,2013(9):74-75.
[5]王爽,王彤.關于檔案信息資源整合的思考[J].蘭臺內外,2013(2):40.
[6]馮惠玲.電子文件的雙重鑒定:《擁有新記憶———電子文件管理研究》摘要之三[J].檔案學通訊,1998(3):32-35.