羅娜
一、大數據的優勢
大數據的概念提出后不久,該技術即和云計算一起對于網絡社區、氣象災害控制、疾病預防等領域中被廣為運用。由于大數據不依賴于隨機抽樣,并未全樣本處理提供了可能,所以大數據幫助檔案管理實現了從靜態向動態的蛻變以及從因果關系分析向現實預測的過渡[1]。下面簡要從“4V”的角度說明大數據的優勢:
1.1 數量(Volume)
大數據技術可以處理TB級的數據量,通過改進算法和運算方式,甚至可以獲得對于更大數據量的處理能力,符合當今數據爆炸性增長的趨勢。
1.2 價值(Value)
大數據進行全樣本的分析,因而這一數據挖掘過程往往會得出一些極富價值的結論。
1.3 種類(Variety)
分析的數據種類極為多樣化,包括文字資料、數據資料、圖像資料乃至影音資料等。
1.4 速度(Veloctiy)
大數據處理要求在秒級的時間跨度內給出分析結果,這與傳統的數據分析方式有著本質區別。
二、大數據時代檔案管理的可靠性變革
傳統的檔案管理模式中,檔案由專人于專門場所保存,一旦檔案失竊或者檔案儲存場所遭受了自然災害,那么被保存的檔案容易遭受到不可逆的破壞。而在大數據時代,數據的存儲往往依托于多臺主機完成,即便某一臺服務器發生了故障,系統也可以由其他服務器支撐運行而不至于陷入癱瘓狀態。并且,因為數據通過云端在不同服務器上有所備份,所以這類故障并不會造成嚴重的數據丟失問題,例如,陜西省近期在西安重點建設灃西大數據產業園,其將實現數據的規?;型掏?、深層次整合分析、多領域社會應用、高效益持續增值作為發展目標,意在成為國家政務資源后臺處理與備份中心、國家級大數據處理中心和國內最大的信息資源聚集服務區,目前,中國聯通、中國移動和中國電信三大運營商以及全國人口數據處理與備份(西安)中心、陜西廣電網絡等項目已入區,只要三大運營商在某一片區的服務器出現了問題并因此丟失了數據,儲存于此處的備份數據將會立刻派上用場。當然,在不同服務器之間進行傳播的過程中可能會引發檔案泄露等問題,因此,高校檔案管理系統在大數據化改革的過程中使用權限控制程序、存儲隔離、傳輸層加密、數據檢驗、數據備份、分布式存儲等技術來保證被保存數據的安全可靠。
三、大數據時代檔案管理的高共享性變革
現有的檔案管理中,由于不同檔案歸屬于不同部門管理,并且同一檔案在制作的過程中也往往需要經由不同部分,在這種分開管理的模式下,不同部門之間的交互作用相對較少,這就導致了“信息孤島”的產生,信息的缺乏使得信息的使用者無法有效挖掘數據的全部內容。與之對應,大數據技術作為檔案管理中的新元素,可以保障用戶對于數據的共享性,其通過多個節點構建了較節省存儲空間的用戶間數據交流的平臺,一方面傳統檔案部門難以充分利用信息的困境將會得到有效緩解,不同部門之間將會發揮自身特定的信息優勢,將同一問題的不同角度結合起來,更為科學地解決問題;另一方面,大數據技術也可以減少檔案重復建設等因素所附加的成本,每個檔案管理部門只需要重點建設與自身需求有關的部分,而對于共性的內容,則可以直接借鑒其他部門的資料。
四、大數據時代檔案管理的高附加值化變革
較之傳統的檔案管理,引入了大數據技術的高校檔案管理工作可以創造出更高的單位附加值,一般而言,不同的檔案管理模式創造出來的每封檔案的附加價值是存有差異的,檔案交流程度、檔案存儲數目、檔案檢索方式和檔案覆蓋率等因素均會影響到被保存檔案的價值。大數據改革可以減少檔案管理中所需要的場地和人力,并使檔案管理擺脫存儲空間的約束,海量的數據被存儲于云端或者不同節點,數據管理者可以對于這些數據進行全樣本的分析,進而發生數據背后蘊含的深層次的信息價值。此外,既然更大數量級的數據處理技術變為了現實,那么不同信息儲藏部門之間也就不需要再擔心信息處理能力不足所致的信息失效問題,其相互之間達成有關信息共享的協議的可能性增加,在這種背景下,高校內各部門乃至各單位的檔案聯系更為密切,檔案管理者或者數據發掘者可以采用一種交叉學科的視角,更為全面地解釋一個社會問題,而在紙質檔案時代或電子檔案時代初期,不同部門之間的信息獲取壁壘使得解釋者的思維往往囿于自身所掌握的有限資料,這既無益于解決對應問題,還容易造成從業人員思維方式的“僵化”。
綜上,大數據技術自身的特點決定了其必然會為高校的檔案管理工作注入諸多新的元素,包括檔案管理系統在可靠性、共享性乃至信息附加值上的改變等,可以說,這種變革是一種雙面的創新,如果其成功過渡,將會對提高我國高校檔案管理工作的能力和效率大有裨益,但與此同時,這一過程中存在的風險及問題也是檔案工作者所必須正視的問題。因此,如何有效抓住大數據時代的機遇實現有效的技術創新是高校檔案管理工作所必須認真思考的問題。
(作者單位:陜西榆林學院黨政辦公室機要科)