宋美霞
1 大數據的相關概念
大數據(Big Data)是繼云計算、物聯網之后IT產業又一次顛覆性的技術革命,其作用堪稱一次新的工業革命。最早提出大數據概念的美國麥肯錫公司給大數據下的定義是:“無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合?!边@一定義也被維基百科認可收錄。當然,在研究界,還有從其他角度定義大數據的,例如,國際數據公司提出大數據的4V定義,認為大數據除了容量(Volume)、多樣性(Variety)、速度(Velocity)之外,還應具有價值(Value)。筆者認為,這一定義從大數據特性出發,更具合理性。
所謂容量,就是指大數據的數量維度,大數據就是海量數據的集合,是人們無法短時間內搜集、理解的數據,它的技術單位不是傳統的MB、GB,而是TB乃至PB。多樣性不僅僅是指數據類型的增多,還指數據的生產、傳播方式增多。就數據類型上,有結構化數據、非結構化數據、半結構化數據,就數據的生產與傳播上,數據不再停留在單一的來源,我們每個人都是信息的生產者與傳播者。速度是指大數據的時效性,大數據時代下,信息的流傳速度增快,信息的“保質期”更短。而價值作為許多學者的爭議點,認為大數據不僅是指數據的量,還應該包括數據的質這個維度,這里的質是指數據的精確性與價值性。
2 大數據背景下數字檔案館
2.1 數字檔案館。數字檔案館是在傳統檔案館的基礎上發展而來的,不同于傳統檔案館管理單一,服務意識低等,數字檔案館具有信息資源共享,服務意識明確,信息的傳播、組織網絡化、數字化等特點。當然,并不是說數字檔案館在大數據時代就完全取代了傳統檔案館,它們之間在服務領域上有所區別。所以,雖然存在繼承與被繼承、競爭與被競爭的關系,數字檔案館是在依托網絡與海量數據的基礎上實現檔案的資源管理,它具有的優勢就是檢索與使用方面,信息服務的種類多,面向用戶,但它還是要依托傳統檔案館的信息基礎。在實際的應用中,因為傳統檔案館從無到有,經過多年的發展,已經被大眾接受和認可,而作為新興事物的數字檔案館無論是服務模式還是運行成本,都相對處于不利地位,并且數字檔案館也出現了一些問題,包括檔案信息資源建立復雜、信息用戶需求多樣化、信息設施建設落后、信息人員素質不高、安全問題,等等。所以,如何認清這些問題直接關系到數字檔案館的可持續發展。
2.2 大數據數字檔案館面臨的問題
2.2.1 檔案信息資源建立復雜。傳統的檔案館之間幾乎沒有聯系,信息的搜索難、利用效率低,數字檔案館雖然依托于大數據的海量數據,但是,在資源的建設初期,各個檔案館之間的數據與信息往往也處于同樣的分散狀態,而大數據信息就有時效性。所以,檔案館里始終存在數據的搜集、整理這一步驟,這也就導致各個檔案館之間的信息不對等、信息交流障礙多,沒有真正實現大數據時代下數字檔案館應有的自由、靈活、方便的信息數據交流模式。
2.2.2 信息用戶需求多樣化。數字檔案館在大數據時代面對的困難是信息用戶的多樣化需求,服務難度提高。大數據時代,許多信息中心,都積極建立新的搜索引擎與數據服務,例如,圖書館在應對大數據時就非常注意結合用戶需求積極開發新服務。而數字檔案館由于在基礎工作中占用了大量的人力、物力,而用戶的個性化與定制化需求越來越多,所以數字檔案館長期存在對用戶的多重需求的滿足度不夠這一問題。
2.2.3 信息設施建設落后。大數據帶來了大量的、復雜的、需要多重分析的數據,而單靠傳統的計算機配置與相關軟件已經不能滿足這種復雜的數據分析要求,所以,就要求數字檔案館有較高的信息設施。數字檔案館的信息設施建設就是檔案館的軟硬件建設,這不僅包括一些硬件的革新,包括計算機的升級換代、服務器的換代,還包括一些軟件開發與引進。所以這就要求數字檔案館可以評估自己的投入成本與運營陳本,盡可能地改善軟件硬件條件,為迎接大數據作準備。
2.2.4 信息人員素質不高。信息人員的綜合素質間接決定了數字檔案館服務的好壞。綜合素質包括業務素質、工作服務素質、管理素質等。業務素質是指數字檔案館在面對大數據的環境下,必須做到掌握較高的網絡技術與計算機技術以及數據的開發、編輯等技術;工作服務素質是指工作人員要有服務意識,要積極迎合用戶的需求來提升服務質量;管理素質不僅僅針對數字檔案館的管理人員,即使是基層員工,也應該具有管理意識,管理好本職工作。但是,實際的檔案館中,存在著技術人才缺乏,管理意識與能力低等問題。所以,檔案館可以根據自己面對的實際問題,結合自己的人事規劃,加大培訓力度,積極引進人才,只有“內提高、外引進”才能不斷提升整個工作團隊的素質,提升檔案館的數字化程度,創造更有價值的服務。
2.2.5 安全問題。大數據是信息爆炸的時代,研究大數據背景下的數字檔案館的安全問題具有重要的現實意義。檔案館不同于圖書館,它的安全性要求高,因此開放性低,所以,在剛開始面對大數據時,不少學者和專家都對數字檔案館是否可行有所思考。
數字檔案館在大數據的背景下,安全性受到威脅,這是因為,首先在數字檔案的生成過程中,就面臨著泄露、損壞的風險,因為技術人員如果不了解檔案的制作以及保存要求,就很可能在制作的過程中造成數據的丟失與損害,使得數據的保存效果不佳。其次是在數字檔案傳播過程中存在風險因素,互聯網與移動技術的發展帶來了技術的革新,但是也出現了一些不可控因素,例如病毒、黑客攻擊等會對檔案的管理帶來很大威脅。所以面對大數據環境下,要更注意數字檔案館的安全問題。
3 大數據數字檔案館發展前景
3.1 走智能化道路。筆者認為,所謂走智能化道路,就是指數字檔案館在發展過程中要逐步擺脫傳統檔案館低效率工作,引入智能化系統,不斷提高對數據信息的處理、編輯、分析能力。走智能化道路包括了三個途徑,分別是檔案信息資源智能化、基礎設施的智能化以及智能化的滿足用戶需求。首先,是檔案信息資源智能化,信息資源智能化涉及了很多內容,包括信息的搜集、建立、分析、傳播、保存各個方面。舉個例子,以數據的傳播為例,傳統的檔案館中,信息的傳播方式非常單一,信息的傳播速度低,但是數字檔案館一旦引入智能化的軟件技術,就能加速數據傳播,并且使得信息的傳播范圍更廣,智能化的傳播中,可與用戶的瀏覽歷史相結合,有針對性地推薦新的數據信息,這樣既可以減輕檔案館人員的工作量,也可以方便用戶的使用。其次,是基礎設施的智能化,這就是指數字檔案館要不斷提高軟件硬件的配置,大數據時代就是互聯網時代下的數據爆炸,這些數據的分析與利用離不開相應的軟件硬件。最后,也是最重要的,就是智能化的滿足用戶的需求,據調查,“我國90%以上的省市檔案機構已經建立了檔案網站,但在面向用戶的信息服務方面還存在對信息資源的組織和挖掘不足,信息服務的針對性不強,檔案館信息共享不暢通等不足之處”。面對這些問題,數字檔案館必須學習先進經驗,努力開展各項工作,例如,建立新的交流平臺,數字檔案館可以把個性化服務與群組服務聯系在一起,大力開展定制服務,不斷完善用戶信息與使用體驗,從而促進數字檔案館的良性發展。
3.2 提高工作人員素質。工作人員的素質直接關系到數字檔案館的服務質量與服務能力,沒有高素質的工作人員,就沒有高效率的檔案管理工作。大數據時代,數據類型呈現多樣化、速度快等特點,對于信息的處理難度不斷增大,這就要求數字檔案館的工作人員有較高的工作素質。新時期數字檔案館必須走人才發展之路,一方面,數字檔案館可以加強人員培訓,積極組織工作人員參加講座、交流與進修學習,以信息技術、檔案管理的計算機云操作等技術為重點,不斷提升現有工作人員的科技素質。另一方面,檔案館可以根據實際的人事計劃,積極引進科技人才,提升軟件的開發實力。
3.3 完善信息安全保障。大數據背景下的數字檔案館的管理對象與傳統檔案館存在明顯區別,是現代化的電子檔案管理模式,它的產生與發展為檔案信息動態管理與長期保存提供了可能,借助移動互聯網系統與信息管理平臺,將檔案館管理員從繁重的信息整理工作中解放出來。但是大數據具有復雜性,在互聯網技術的迅速發展下,數字檔案館面臨著安全風險,所以,數字檔案館必須不斷完善各項安全保障措施來保護信息安全。首先,盡可能健全制度保障體系,只有加強管理水平,建立檢查監督制度,各個部門各司其職,才能保證數據在生成、保存階段的安全,實現建立穩定、安全的數字檔案館的目標。其次,是加強技術的革新,只有不斷升級服務器的安全級別,才能在數據傳播的過程中保證數據的完整、安全。最后,是強化科技人員的素質,只有科技人員掌握了先進的檔案管理技術,才能保證信息的安全。所以,面對數字化時代與海量數據的沖擊,檔案館必須端正管理態度,走不斷完善信息安全保障的道路。
大數據時代,數字檔案館面臨著許多問題,包括了檔案信息資源建立復雜、信息用戶需求多樣化、信息設施建設落后、安全問題等,這些問題的解決,直接關系到數字檔案館能否良性發展。數字檔案館只有不斷走智能化道路、不斷提高工作人員素質與不斷完善信息安全保障,借助高新科技不斷滿足用戶的需求,才能保證數字檔案館的可持續發展。
(作者單位:周口師范學院 來稿日期:2014-12-11)