文/武漢工程大學法商學院 彭明威
大數據時代檔案管理工作研究
文/武漢工程大學法商學院 彭明威
隨著大數據、移動互聯網、云計算、物聯網等技術的高速發展和廣泛應用,人類社會已悄然從“IT時代”跨入“DT時代”。“數據”是“DT時代”的命脈,數據終極的意義在于預測未來,使檔案工作深受大數據的洗禮,促進我國檔案管理工作的改革與創新。
大數據;檔案管理;檔案工作;大數據時代
如今,大數據對經濟、社會、文化等各個領域帶來了巨大的挑戰和前所未有的機遇,檔案工作不可避免地因為大數據時代的來臨而發生深刻的變化和發展。大數據時代檔案管理是檔案工作者面臨的新課題,檔案工作人員應順勢而為,借勢而上,努力變革管理方法和創新管理理念,重新回到正軌上來。
(一)重構檔案管理業務流程。我國檔案界長期以來將檔案管理業務分為“六個環節”或者“八個環節”,具體為收集、整理、鑒定、保管、登記和統計、利用。因為各個環節之間涉及不同的開發利用主體,客體的價值也在時間的演變過程中和社會不斷進步中變化,無法主動、系統、全面、綜合地對檔案進行有效管理,檔案本身處于相對靜止、被動地位。不能對檔案進行有效的管理。而且,目前來講電子文件已經在檔案份額中占較大比重,電子文件尤其是核心數據元數據在形成、整理、歸檔、移交和長期保存過程中產生的數據量接近EB級別。元數據及其結構、來源、內容描述、形式特征、權限管理、存儲位置、電子屬性、數字化屬性、電子簽名等在大數據時代下都能一一對應、一一展現、全程可追溯,全程可管理,全程可監控。檔案全程管理才得以實現。
(二)實現檔案知識管理模式。知識管理是檔案管理的發展趨勢和未來走向,隨著時代的發展和社會的進步,同時檔案用戶信息素質的提高,傳統意義上簡單數據和文件的提供和推薦,已經不能滿足當今知識經濟時代需要。檔案用戶對顯性知識的吸收更激發了對隱性知識的渴望和追求。因此,檔案利用服務也應從提供粗淺、原始的數據或文件向提供精細、復雜的知識轉變。早在1994年,特里·庫克就提出,檔案工作者應該從實體保管者向知識提供者過渡。然而,知識不是憑空產生的,也不是對原始數據的簡單聚合,而是對檔案數據的挖掘、清洗、創新才能有效展示。才能實現“以知識管理為導向的檔案管理”與“以檔案管理為基礎的知識管理”的目標。
(三)開啟智能檔案服務時代。大數據和云計算的完美結合,使檔案館(室)建立統一的未來語義網成為可能,它不是一個眾多網頁的鏈接集合體,而是一個全球性檔案數據庫,全球檔案數據將數數(開放數據)相連。這將會擴展傳統檔案數據的邊界,填平以往存在的數字鴻溝,開創智能檔案大服務時代。數據終極的意義在于預測未來,現代管理學之父德魯克認為,預測未來最好的方法,就是去創造未來。在大數據時代,數據挖掘包括兩個維度,描述性分析和預測性分析。描述性分析是針對檔案原始數據,揭示普遍性的規律。這是檔案服務精準化的前提和基礎;預測性分析是面對用戶未來需求,預測未來的趨勢。這是智能檔案大服務的根本和核心。通過大數據的整合、挖掘、創新、過濾,使檔案“死”的數據變成“活”的知識;使檔案館(室)從純粹獲取檔案信息資源的物理空間場所變成集成獲得檔案智能服務的知識文化中心;進而極大地滿足檔案用戶的“檔案權力”,使檔案館(室)檔案服務更民主、更科學、更智能。
(一)數據安全缺乏有效保障。隱私不僅僅在觀念和技術層面上,同時涉及法律問題。大數據平臺的巨大開放性,給檔案數據的完整性、有用性和系統性帶來了挑戰,傳統的安全工具和技術不再像以前那么有用,對現行檔案信息數據的安全保護存在很大的技術難度,檔案信息安全面臨著巨大威脅。在大數據時代,數據來源范圍廣,計算機內的每一個數據、每一片字節,都構成了檔案單元信息的基本要素。大量數據匯集加大了信息泄露的風險,而且目前對敏感數據的使用權和所有權沒有明確界定,很多基于大數據的分析都未考慮到保密和隱私的問題,檔案在信息界獨有的憑證價值作用,使得其安全保密要求更高。因此,對檔案中的敏感信息進行分析時,特別需要解決如何做到對信息保密、如何防止數據被惡意使用等問題,但大數據環境的開放性,使擁有海量數據與潛在價值的大數據檔案更加容易吸引攻擊者的攻擊。
(二)數據處理難以卓有成效。大數據時代下無論傳統文獻還是電子數據顯著特點就是海量,并且其數據呈幾何式泛濫,信息呈指數式增長,知識呈爆發式增加,因此存儲數據將是數據管理的重大問題。大數據環境下,數據類型的復雜多樣給檔案管理工作帶來巨大的挑戰,占到數據總量80%以上的非結構化數據,數據格式不兼容,檔案管理人員進行提取分析和
應用實踐等都存在困難,其存儲更是帶來新的安全問題。因當前非結構化數據存儲并不能夠有效地沿用具有嚴格訪問控制與隱私管理的結構化數據存儲模式,而相適應的非結構化數據存儲模式在技術上還不成熟,盡管從傳統數據存儲中非結構化數據軟件能夠獲得經驗,但非結構化數據服務軟件沒有內置足夠的安全措施,而且使用的最新代碼也不完善,所以非結構化數據存在著多種漏洞。因此,需要內建相關的安全因素在客戶端應用程序中,可這樣又反而導致身份驗證和授權過程和輸入驗證等各種安全問題的產生。
(三)大數據檔案人才匱乏。只有通過深度解析檔案大數據,將繁雜、海量、沉睡的檔案數據序化、激活,進而才能達到檔案管理為基礎的知識管理的目標。可以幫助檔案館(室)提供精確化服務、精準化運維,大大降低檔案館(室)運營成本,大數據的巨大作用開始凸顯。現行的檔案館(室)的全流程的收集、整理、加工、優化、脫敏都基于大數據的精準分析,擁有檔案專業知識、互聯網技術、大數據理念的復合型人才能勝任。盡管數字化、電子化檔案發展勢頭迅猛,但是大數據人才發展相對比較滯后。大數據檔案人才是跨多個專業層次、多個學科領域的復合型跨界人才,既要了解計算機網絡通信技術,又要掌握解構中英文的能力,還需要擁有建立多維度模型框架的能力,同時具有對檔案數據趨勢的敏感性和對用戶檔案需求的前瞻性。而且隨著數據標準化工作日益完善,種類眾多、類型多樣、載體形態復雜的檔案會大幅增加,知識型檔案需求大量涌現都對檔案管理人員的個人能力等提出了更高的要求。鑒于此,大數據檔案人才在某種程度出現斷檔和缺乏。
(一)多層面保證數據安全。開發利用檔案資源和保守檔案機密,是黨和國家賦予檔案部門的兩個不同方面的重要職能。
大數據技術與信息安全技術的對接。當今信息安全領域廣泛應用的匿名技術。隨著大數據預測技術的發展,要不斷更新維護且研究更精確的計算方法完善匿名技術,才能解決大數據時代檔案用戶信息隱私問題(大數據技術要與信息安全技術實現無縫對接,利用大數據技術的優勢發現各種信息系統中存在的信息風險與漏洞。盡早查殺惡意病毒軟件,防止檔案用戶隱私信息因為系統安全問題遭到泄露。最后,政府應該加大對數字隱私權基礎設施建設的投入。相應立法也應同步跟進,這樣才能形成良好的信息環境。
大數據時代檔案數據資源的保護僅僅依靠單純的技術手段是不夠的,唯有從多個層面協同起來保證數據安全,首先,應該發揮法律在保護檔案數據和隱私的基礎作用。其次,在日常的處理大數據的操作流程中,建立檔案安全管理制度規范及安全管理培訓機制。最后,也是重中之重,提升檔案管理人員的安全意識和安全觀念,加強檔案管理人員數據安全處理能力。
(二)云計算與大數據深度融合。根據IDC(國際數據公司)的監測統計,2011年全球數據總量已經達到1.8ZB(1ZB等于1萬億GB,1.8ZB也就相當于18億個1TB的移動硬盤),而這個數值還在以每兩年翻一番的速度增長,預計到2020
年全球將總共擁有35ZB的數據量,增長近20倍。大數據時代已經到來,因此未來檔案信息處理技術的發展也要充分結合大數據時代發展變化,傳統文獻的電子化數據及數字化檔案文獻必須脫離于實體存儲設備,通過云計算技術的發展,形成云計算機網絡,使大數據的信息處理不再依賴于硬件設備,通過上云端就可以實時處理。此外,在大數據時代下,計算機與網絡的深度融合一體化將是一個必然的發展趨勢,當計算機和檔案信息網絡融合成為一個整體的大數據網絡平臺時,對檔案數據的處理也將不再是以零散、單個的方式進行,而是以規模化方式進行。未來將轉變為以大數據云端為中心,這也將極大提高未來計算機信息處理技術的響應速度和處理精度,使計算機信息處理技術變得更加高效和精準,進而更有力地推動檔案大數據的發展。(三)創新檔案人才培養機制。以大數據時代、知識經濟的社會需求為導向,以檔案工作發展為依托,筆者認為,大數據檔案人才的要義是以檔案學專業為基礎,以擴展檔案人才知識結構為重點,以良好的綜合能力為標準,構建大數據時代檔案管理的復合型人才。國家應從頂層設計上把大數據檔案人才培養納入檔案人力資源開發的整體規劃中來,必須在戰略層面對檔案專業人才的架構進行創新性變革,在各大高校組織上統籌科學安排;高校應結合自身優勢和特點來科學設定培養目標,創新檔案人才培養方案,精選合作教育實踐平臺,開創多元化、特色化教授實踐新格局;檔案管理人才(高校檔案專業學生和檔案事業工作者)需要積極夯實理論基礎,廣泛涉獵多個學科(管理學、社會學、計算機科學、心理學)領域知識,努力培養創新思維模式,持續獲取信息創新素質,建立檔案管理核心競爭力。
大數據時代的洪流滾滾而來,檔案工作也必須與時俱進,創變求新。大數據技術應用于檔案工作,必將喚醒、激活檔案大數據價值,實現檔案管理從數據管理到知識管理的轉變,開創檔案工作知識管理時代。
[1]徐擁軍.傳統檔案服務向知識服務過度研究[J]北京檔案,2009(04):16-18.
[2]曹芳.近十年來我國電子文件研究論文的統計與分析[J].檔案學研究,2003(04):45-49.
[3]李雄.新網絡條件下的數據安全新問題[J].信息通信技術,2015(01):39-43.
[4]陸天波.基于互聯網的匿名技術研究[J].計算機科學與探索,2009(3):1-17.
[5]2011年全球數據總量1.8ZB 當"大數據"來敲門[DB/OL].
h t t p://n e w s.x i n h u a n e t.c o m/t e c h/2 0 1 2-12/24/c_124136973.htm 2012-12.
[6]朱建邦.論高層次檔案人才的培養與開發[J].北京檔案,2014(01):21-22.