文/正元地理信息有限責任公司山東分公司 劉文照
大數據時代檔案管理模式的轉換與創新
文/正元地理信息有限責任公司山東分公司 劉文照
本文論述了檔案管理大數據特征;大數據時代檔案管理面臨的挑戰;大數據時代檔案管理變革策略分析。
大數據時代;檔案管理模式;轉換;創新
(一)大數據帶來的挑戰。2012年以來,“大數據”一詞越來越多地被提及,人們通常用它來命名與之相關的技術發展與創新,并定義和描述信息爆炸時代產生的海量數據。檔案本身是一種具有原始性物證的載體,更是一種特殊的信息資源,在大數據時代被賦予了新的內涵,是大數據極為重要的組成部分。如何抓住大數據初現的歷史機遇,實現檔案管理方法、理念及模式的轉換與創新,以適應新時代信息收集、傳播、利用的新趨勢是檔案部門面臨的一項新課題。與此同時,傳統檔案管理利用模式也受到大數據高度關注可用性特點的挑戰。
(二)大數據的基本特征。一般認為,大數據(big data,mega data),或稱巨量信息、巨量資料,是收集和分析大量信息的能力,目的在于從復雜的數據里找到過去不容易昭示的規律。通常認為,大數據具有4個“V”字開頭的特征,即體量大、多樣性、價值密度低、速度快。相比 “數據”而言,“大數據”的顯著特征是:第一,數據的屬性是包括結構化、非結構化和半結構化數據。第二,數據之間頻繁產生交互,大規模進行數據分析,并實時與業務結合進行數據挖掘。
大數據是繼云計算、云存儲、移動互聯網和物聯網等新技術新應用之后IT產業又一次顛覆性的技術變革。它影響著科技、商業、企業、政府和個人等各個領域,整個世界步入了大數據時代。檔案界也不例外,滾滾來襲的大數據浪潮也必將使傳統的檔案工作發生變革。檔案管理的思維,檔案資源的組織、收集、存儲、利用方式都在發生新的改變,呈現新的特點。
(一)檔案數據資源種類繁多。目前,檔案數據主要來源于兩個方面:1.各業務部門通過業務系統產生的業務數據轉為檔案數據。2.檔案部門通過人工填寫、錄入、搜集歸類后轉為檔案數據。前者具有及時、廣泛、數據量大、內容繁雜的特點;后者最常見的是將館藏的實體檔案通過數字化技術轉為檔案數據,如掃描、拍照等??梢姡S著全面開展按照“存量數字化”和“增量電子化”要求,檔案數據資源的數量必將呈幾何級增長,形成真正意義上的檔案大數據。檔案管理的信息資源呈現多元化:有檔案內容、檔案管理、檔案實體、檔案應用和檔案館樓宇管理信息資源。這些資源中存在著大量的結構和非結構化的種類繁多的數據,既可以讓用戶滿足利用需求獲取檔案內容信息;也可以讓管理者獲取檔案管理知識,協同處理檔案業務工作。
(二)檔案數據資源價值密度低。在傳統檔案管理工作中,一直存在“重藏輕用、重資源輕管理”的現象,人們既要盡力避免檔案實體漲庫,避免檔案信息存儲空間限制,又要防止有效檔案資源被淹沒海量檔案中間降低利用價值;而在利用環節,人們追求檔案如何在需要時應有盡有,同時要能被快速、準確地檢索出來。因此,從這個意義上來說,檔案價值的實現更多地體現在“用”上,而檔案的“用”要做到全智能服務。應用大數據技術,可以通過主動調查業務部門的需求,建立各種數據模型,對海量數據進行聚類、分類、數據挖掘與分析,實現有針對性、個體化的服務,將數據進行系統地收集、分析、發現和預測,從而建立起更切合用戶需求的檔案信息服務模式。
(一)技術瓶頸有待解決。在實際檔案管理工作中,大數據技術的應用將面臨新的挑戰。譬如:庫房資源成為檔案管理存儲的瓶頸;如何將大數據解決方案與傳統的檔案信息資源、數據存儲和應用技術進行融合銜接?可見,設計最合理的分層、分級存儲架構已成為數據管理及服務的關鍵技術,當然還要有穩定的信息整合、遷移和歸檔技術。
(二)檔案部門的職能義務。如今的檔案部門不但要承擔收集和保存好檔案資料的社會責任,還要承擔檔案信息資源有效利用和產出良好社會效益的重任。結合大數據帶來的挑戰和機遇,檔案部門已經開始朝著知識管理、信息服務的方向發展,運用大數據理念,在保障國家安全、商業秘密、知識產權、個人隱私的前提下,全面整合開放并管理公共數據信息資源,以滿足全社會對信息資源的利用需求,發揮檔案部門的數據主體地位和職能作用,是值得深入思考的問題。
(三)法律規范需完備。在新形勢下,各個加入大數據應用的檔案館可以通過有關的協議共享彼此的信息資源,這樣數據的處理和傳輸將會在一個虛擬的空間內進行。同時也會帶來訪問和隱私的安全性、穩定性和可靠性等一系列問題。從目前國內大數據的產生和應用來看,立法工作明顯滯后,不但在數據保護方面缺乏相應的法律規范,在信息安全度方面也缺乏有效的監管機制和準入制度。
大數據給檔案管理思維帶來了沖擊,要求我們要用發展的眼光認識、尋求檔案管理理念和檔案工作的整個流程的突破和創新,要從館藏內容的構成、資源開放體系構建、開放平臺和應用技術的運用與檔案服務方式的改進等多方面著手,構建一個親近、便捷、有魅力的開放型檔案館。充分利用大數據挖掘、分析技術,實現信息資源整合,做到緊密銜接、全程動態管理和安全可靠。制定大數據時代檔案管理的規章制度,明確目的和標準,做到檔案管理規范化。