李博
摘要:隨著全球數字化的到來,我國在數字技術方面的突破也有了很大進步,國內很多行業也都響應國家的號召,將數字化技術良好的應用在行業的發展與建設中個,不僅為各行業的發展提供了有利的技術條件,還為國家的整體發展奠定了堅實的技術基礎。其中在檔案管理行業,數字化技術更被很好的應用其中,這種先進技術的應用,不僅為檔案管理人員帶來了便利,提高了他們的工作效率,還為檔案管理事業的建設與發展提供了保障。本文就大數據時代檔案數字資源整合方面的內容進行簡要的論述,并通過對其難點的分析以及相應的解決對策進行介紹,僅供參考。
關鍵詞:大數據;檔案數字資源整合;對策分析
在過去的檔案資源整合工作中,相關的工作人員會因為檔案數量龐大,檔案信息復雜而加大工作壓力,導致身心疲憊,從而影響工作效率,讓檔案管理的整體發展狀態得不到良好的提升。但是,隨著數字化時代的到來,傳統的檔案資源整合管理被有效的進行了改進。在檔案資源整合的工作中,相關技術團隊將數字化技術與檔案資源整合進行了有效的結合,并對相應的工作人員進行了技術指導。這種技術應用不僅大大的提高了檔案工作人員的工作效率,還保證了工作人員的工作質量,為檔案事業的整體發展提供了強有力的武器,還在一定程度上讓更多的人民群眾享受到了方便快捷的服務,提高了國家整體的發展水平。
一、檔案數字資源的大數據特征
(一)數據量大,增長迅速
在大數據時代,我國檔案數字資源建設可分為“增量檔案電子化,存量檔案數字化”兩大部分。據國家檔案局的統計資料顯示,我國檔案館館藏檔案資源豐富,僅國家檔案館在2011年的館藏已達3.3億卷。隨著館藏檔案數字化工作的推進,它們將匯聚成巨大的檔案數字資源庫。因為大數據技術能挖掘出以前無法為人們所發現的數據的潛在價值,因此有必要對數據的檔案屬性進行重新鑒定,自然會有海量數據新增到檔案領域。
(二)分布廣泛,多源異構
在大數據時代,隨著人類探索領域的日漸深入,以及在此過程中數據保存能力的提高,檔案來源將更加多樣;加之移動終端的飛速發展更導致了數據產生方式呈現出多樣性的特征。可見,大數據時代的檔案數字資源將廣泛存在于不同的信息系統中,會帶有明顯的時空特性,形成分布廣泛的大量異構數據。
(三)真實可靠,價值巨大
在大數據時代,面對龐雜的新數據來源,信息價值密度正在大幅降低,人們更需要精確的信息來了解外部世界的真實情況,進而做出決策判斷。檔案作為人類社會最重要的本源信息,在應對高并發、大數據量的利用訪問需求時較之其它網絡信息資源具有明顯優勢。在大數據時代檔案價值將得到更廣泛的關注,檔案在人類生產生活中將發揮更大的作用。
二、大數據時代檔案數字資源整合的難點
(一)數據存儲問題
在大數據時代,檔案數字資源整合的首要挑戰來自數據存儲。一是檔案管理系統在面對海量數據時需要高可擴展性的支撐。而目前集中式的數據存儲和管理模式非但資金投入較大,更無法適應檔案數字資源體量激增的新情況,在檔案數字資源的高效存儲和快捷訪問方面面臨嚴峻挑戰。二是目前基于關系型數據庫研發的檔案管理系統無法適應大數據時代占數據總量10%以上的非結構化數據存儲和處理的需要。
(二)數據分析問題
大數據時代是一個泛在信息、泛在知識的時代,隨著信息化程度的加深,檔案數字資源的來源結構將發生巨大變化,傳統的基于封閉的結構化數據進行的數據挖掘算法在分析處理非結構化數據時存在局限。但目前檔案數字資源整合還處于數據整合階段,偏重于實現異質異構數據在物理或邏輯上的集中和互聯互通,僅能為用戶提供信息檢索服務,這與大數據時代的要求相去甚遠。
(三)安全隱私問題
檔案數字資源不同于其它信息資源,它是國家和社會精心挑選并保存下來的真實的歷史記錄,其中包含著大量國家秘密、工作秘密、個人隱私等重要信息,事關國計民生。在大數據時代。如何選擇合適的安全防護策略以適應數據非線性增長的需求,杜絕安全隱患?如何應對大數據分布式處理帶來的數據、隱私等的泄露風險?這些都是擺在我們面前不可回避的重要課題。
三、應對策略
(一)樹立適應大數據時代的“大檔案觀”
大數據時代賦予了檔案數字資源新的特征,因此要實現其整合在很大程度上考驗著檔案基礎數據的質與量。這就要從“社會記憶”的高度重新審視檔案數字資源的構成范圍和收集視角,改變過去以黨政機關文書檔案為主體的收集模式,加大對社會民生、對個人等復雜化、碎片化信息的關注,使檔案能真正反映政治、經濟、科技、文化、社會生活等的全貌,反映國家和社會的實時變遷。
(二)構建適應大數據要求的檔案數字資源分析生態系統
各檔案部門應根據國家統一規劃以及自身基礎設施建設與檔案數據庫資源匹配程度的具體情況,靈活選擇適合的云部署方案。對于那些處在檔案數字資源整合關鍵節點的部門應架設私有云,其它部門可根據自身情況將關鍵數據存放在私有云,同時以動態申請公有云的方式彌補自身計算能力、存儲空間等的不足。
(三)加強大數據時代檔案數字資源整合的管理人才體系建設。
作為檔案數字資源的組織者,就要求檔案從業者善于學習,能實時更新自己的知識結構,既要熟悉檔案業務又要對云計算技術、大數據分析技術等有所涉獵。唯有如此,檔案從業者才能準確表述自身在檔案數字整合過程中所要實現的各項需求并加以精確、細化,才能與工T技術人員、數據分析人員形成良好的溝通。
四、結束語
在我國當下的發展過程中,雖然檔案的數字資源整合管理層面的建設與發展已經處于逐步上升階段,但是檔案管理事業整體的發展水平與國外一些國家相比,還是相對落后的。面對這種情況,就需要國家相關管理團隊,對我國檔案事業現階段的發展情況進行具體分析與研究,并探索出檔案管理事業在發展過程中存在的問題與不足,并做到具體問題具體分析,制定出合理妥善的改進方案,將檔案管理發展中的問題逐一解決,這樣在未來的發展中,檔案管理事業才能在保證工作質量的情況下,為廣大人們群眾提供更有效的服務,國家整體的發展水平才能有所提升。endprint