滕霞
摘 要:隨著大數據時代的來臨,大數據作為重要的戰略資源在各行各業開始發揮重要作用。檔案是重要的信息資源載體,管理人員更應該應用大數據技術,加強對檔案資源的開發利用。文章簡述了檔案大數據的含義、特點及作用,并分析了大數據對檔案工作的影響及大數據時代下的檔案價值提升及管理策略。
關鍵詞:大數據時代;檔案管理;價值提升
中圖分類號:G270.7 文獻標識碼:A 文章編號:1671-2064(2017)13-0206-02
進入21世紀,人類在信息存儲和處理能力方面,不斷涌現技術性的突破。隨著物聯網的廣泛應用,社會組織的海量信息衍生出巨大數據,再一次顛覆“云”理念,進而迎來了大數據時代。在大數據來臨的新形勢下,對這些數據的收集、存儲、挖掘,既是現代檔案管理工作的難點,也是機遇。
1 大數據
大數據泛指那些超過傳統流程和工具處理或分析能力的數據。簡而言之就是巨量資料、海量信息。從本質上看,大數據主要解決的是海量數據存儲、計算、挖掘和利用的問題。其特點可概括為“4V”。(1)規模性。數據容量巨大,大型數據集合一般在幾十TB至PB級的數據量;(2)多樣性。數據類別繁多,數據來自多種數據源,數據種類和格式日漸豐富;(3)高速性。數據處理速度快,在數據量龐大的情況下,實現數據的實時處理;(4)價值性。數據真實性高,愈發需要有效的信息資源確保其真實性與安全性。可以說大數據時代,是一個數據資源更加豐富的時代,是一個信息技術更加先進的時代,是一個知識管理更加智能的時代,是一個檔案資源更加燦爛的時代。
2 檔案大數據
檔案大數據是指在檔案方面涉及的資料量規模巨大到無法通過目前主流軟件,在合理時間內達到擷取、管理、處理并整理成為幫助檔案館決策或更為積極目的的信息。大數據關鍵是存儲管理和檢索使用,這恰恰與檔案領域的資源建設和利用體系相對應。檔案大數據的4V特點主要表現為:檔案數據的規模巨大。目前館藏電子檔案,一方面來源于館藏檔案數字化,一方面來源于原生電子文件的移交歸檔。2012年底,楊冬權局長在全國局長館長會議上作出指示,“到2020年全國各級綜合檔案館紙質檔案數字化的數量比2010年翻兩番,電子檔案接收工作全面開展”。自國家到各省各地綜合檔案館開展了如火如荼的百萬館藏檔案數字化工程,電子檔案的移交與接收也提上日程。目前,館藏數字檔案量已經從TB級別躍升至PB級別,僅以“十一五”末我國館藏檔案總量的統計看,已達到近4億卷,每卷約3厘米厚。那么,可以估算我國檔案正以每五年40%速度遞增。與往昔相比,檔案館所存儲的信息呈爆炸式的增長態勢。檔案大數據的類型繁雜。科技進步衍生出的數據呈現分布式和異構特點,需要歸檔的數字數據的種類繁多,包含結構化的數據,同時也有非結構化數據與半結構化數據。非結構化數據是不方便用數據庫二維邏輯表來表現的數據,如文本、圖片、各類表格、圖像和音視頻等;半結構化數據是介于非結構化數據與結構化數據之間,如E-mail、HTML文檔。這些數據,構成數量龐大、類型多樣的檔案資源信息庫。檔案大數據的價值性高。受檔案自身特點影響,檔案價值的實現必須依賴于檔案利用作為載體。在海量檔案數據的利用過程中,數據價值密度相對較低,但數據價值卻極為重要。從眾多檔案利用效果實例可看出,檔案信息在提供資政查考、服務社會等方面起到不可替代的作用。大數據時代下,使用海量信息處理工具,通過數據挖掘和智能分析,小數據也能有大價值。
3 大數據時代對檔案工作影響
3.1 檔案部門電子檔案資源增長迅速
隨著信息技術進步,特別是OA、MBD、ERP等辦公、設計、制造管理軟件的廣泛應用,檔案部門很容易將以往紙質檔案歸檔工作方式轉變為電子檔案歸檔工作模式。而且大數據時代檔案部門需接收保存的數據資源也較多,再加上館藏資源數字化所產生的電子檔案,因此單個檔案館數據資源總量很容易達到TB、PB級,而且增長迅速。
3.2 檔案部門館藏資源價值顯著提升
館藏檔案作為國家或企業所保存的歷史記錄,本身這種數據資源就具有很高的價值。在大數據時代,與圖書、網絡資源等數據資源相比,館藏檔案是一種最真實、最可靠、最具權威性與憑證性的信息資源,其在大數據的數據中占有非常重要的位置,也較易被利用,這就使得大數據時代館藏檔案的價值得到了充分體現,其價值顯著提升。
3.3 檔案服務利用方式急需革新
大數據技術發展推動了檔案管理的科學化,在龐大的數據信息源的支持下,檔案館的服務將走向結論化、知識化和智能化,從而改變以往簡單復制、查閱等利用方式,減少了服務過程中的不確定性。而且用戶希望提供個性化、可視化服務,也對檔案部門的服務利用提出了新的需求。大數據時代的發展將實現真正的個性化服務,不僅提供用戶所需要的信息,還通過對用戶需求進行分析,提供基于海量分布式資源的精細化知識組織輸出,即實現信息解決方案的一站式服務。
3.4 檔案信息安全受到威脅
當前檔案數據庫一般應用關系性數據庫技術,在保證數據安全方面可以設置嚴格的訪問控制和隱私管理工具。而大數據依托的基礎技術是非關系型數據庫,在成熟度和可控性方面都不如傳統數據庫技術,數據處理速度與時間之快,對傳統檔案信息安全體系帶來極大沖擊,對檔案信息安全產生了極大威脅。
4 大數據時代下的檔案價值提升及管理策略
研究大數據,已經滲透到當今每一個行業和業務領域,成為重要的生產因素。毫無疑問,未來檔案館的核心競爭力很大程度上取決于將檔案數據轉化為信息和知識的速度與能力。檔案部門作為存儲信息、提供信息服務的信息中心,必須主動創新,推動檔案工作向“知識化、信息化、技術化、市場化”變革,利用大數據技術實現戰略發展以滿足未來需求。
4.1 轉變觀念,加強檔案大數據管理能力建設
隨著各行業全球化、數字化、網絡化程度的不斷提高,各類數據的采集變得越來越容易,海量數據的累積與利用為那些把握機會的企業開啟了商業成功大門,提供了更為有利的抓手,使戰略決策有的放矢,事半功倍。大數據是時代發展的必然趨勢,同樣,也是檔案領域無法逃避的未來技術發展形態,為未來檔案管理與服務方向提供了新的思路和解決方案。因此檔案人員必須轉變觀念,盡早盡快投入到大數據研究上來,掌握并應用大數據技術,加強檔案大數據管理能力建設,推動檔案工作進步,才能適應信息技術進步,滿足未來社會檔案服務需求。
4.2 提升檔案工作員工綜合素養
要建設檔案強國,首先要建立一支與檔案強國相匹配的檔案工作員工隊伍,特別是大數據時代,檔案工作不再是裝裝訂訂,檔案利用也不是簡單查閱,檔案人員應從數據的視角看待檔案,以大數據推動檔案館的管理和服務。這也對檔案人員提出了更高要求,大數據時代,檔案館人員要努力向“數據科學家”轉變,大力提升綜合技能,一是具備一定數學知識能夠建數據模型,二是能夠利用信息技術建數據模型分析系統,三是處理數據,得出結論見解,從數據中講出故事來。
4.3 大力推進館藏檔案數字化,管理知識化
大數據時代,館藏檔案不應再是紙質檔案的實體形式,也不應是不可處理的電子檔案(PDF)形式,而應具備基于數據信息的數字形式,館藏不僅僅是“查閱”的對象,而應轉變成為一種基礎數據資源。因此,檔案部門工作重心應轉到館藏數字化工作上來,加強館藏數字化轉為內容數據的能力建設,大力推進館藏數據資源建設,將檔案管理提升到知識管理層面,為大數據時代的檔案管理與服務奠定堅實的數據基礎。
4.4 創新檔案服務方式,加快市場化開放進程
大數據時代的到來,使得模糊的因素得以清晰的顯現,大數據對檔案工作的影響還體現在服務職能化層面上,隨著信息技術的不斷發展,檔案服務更有針對性、更為準確、更能滿足用戶的想法和需求。換言之,檔案服務方式將升級為數據服務,大數據時代,閱覽、咨詢、展覽等傳統檔案服務將得到變革,而以館藏為基礎,為社會提供數據分析服務、數據挖掘服務將成為大數據時代檔案館的常態服務內容。如何將死檔案變成活資源,使得同一空間原本孤立的檔案資源相互連接,形成一個綜合的智能化的系統,這個系統能夠為需求者提供全面的服務,將是檔案管理者面對的直接挑戰。
4.5 加強檔案資源集群建設,打造數據資源平臺
大數據時代,各檔案館之間互聯互通,實現館藏資源共享,打造集群檔案資源和數據平臺意義重大。尤其在當前,許多檔案館本身館藏數據都分散在互不聯通的數據庫中,如何將這些數據庫打通,實現各數據庫乃至各檔案館間資源共享,才能提升檔案工作的大數據水平,才能充分體現出館藏數據的價值。從信息技術層面來看,科學利用云計算技術,將我國各檔案館資源進行整合集成,打造并建設中國檔案云,將可以實現這一目標,因此我國檔案部門必須大力推進信息化建設,為大數據時代的檔案工作奠定堅實的信息化基礎條件。
4.6 加強大數據技術研究與應用,推動檔案工作向技術化轉變
檔案部門要緊跟大數據時代信息技術發展,密切關注流處理、并行性、摘要索引和可視化等大數據應用理論研究,在檔案工作中研究引進并應用大數據數據庫管理、數據模型構建、數據分析、數據挖掘、云計算等技術和計算機軟硬件設備設施,構建檔案工作的大數據管理技術能力,進而推動檔案工作向技術化進行轉變,提升檔案工作水平,促進檔案工作在大數據時代實現跨越式發展,以滿足大數據時代的檔案工作要求。
4.7 加強檔案數據信息安全管理
大數據時代是一把雙刃劍,社會因大數據而獲益匪淺,檔案工作位勢和聲譽會得到提升,但一些隱私信息也將無處遁形,大數據時代下,檔案部門除了建立傳統的反黑客、反病毒、防盜竊等信息安全保護技術,抵御外來入侵者的威脅外,還需要特別加強數據信息安全管理,建立全面數據信息安全保障體系,確保數據信息資源在共享、利用時能保護機密信息、隱私信息,杜絕信息安全風險,保證國家秘密安全可靠,個人隱私不被隨意踐踏。大數據是時代發展的必然趨勢,它將各種新技術、新產品與我們的生活緊密地聯系在一起,全面地、深刻地改變著我們的生活方式和行為模式,同時也影響著檔案工作的發展方向,隨著大數據時代的到來,檔案工作勢必面臨著前所未有的變革與挑戰。如何避免在數字化時代被邊緣化,是檔案部門不得不正視的一個問題。同樣,大數據時代也創造了更多的機會,檔案部門只要把握機會,順應時代的發展,加快大數據能力建設,整合館藏資源,創新服務方式,檔案工作也必將迎來更為廣闊的發展空間。
參考文獻
[1]王秀清.大數據時代企業檔案信息資源開發利用的思考[J].北京石油管理干部學院學報,2014(3):14-18.
[2]吳放,馮銳.大數據時代高校檔案信息資源建設的新思考[J].蘭臺世界,2015(29):26-28.
[3]龐然.企業檔案信息資源開發與利用的思考[J].檔案天地,2014(1):53-55.