張枝
摘 要:伴隨著大數據時代的到來和檔案智能化管理的需求,現在的檔案管理中,為了更好的采集信息和檢索整理信息,提高現有的檔案管理水平,大數據技術的應用越來越被各個領域所重視。隨著計算機技術的成熟,建立檔案管理已存在必要性,檔案管理信息的核心就是大數據信息的管理和數據挖掘,通過計算機挖掘有效的信息,優化檢索程序,最終實現資源共享,研究基于大數據技術的信息管理挖掘技術,對于提高檔案管理的合理性以及檢索程序的從簡化具有重要意義。
關鍵詞:檔案管理;數據挖掘;大數據
現在的檔案管理系統中存在一定的弊端,不足以滿足現有的需求,為了提升數據的快速查閱和檢索性能,大數據技術應用于檔案管理系統走向必然,將數據挖掘技術應用于檔案管理中,首先需要構建信息的數據庫,并對錄入信息的有關聯特征進行提取分析,從而建立檔案信息管理系統的閉頻繁項集后綴項表,進行大數據的數據挖掘,計算機挖掘技術挖掘技術應用于檔案管理中,能有效的節省檢索時間,優化檔案管理流程。
1.大數據時代下的數據挖掘技術
數據挖掘已經成為信息管理檢索信息的關鍵,數據的產生和收集是信息管理的基礎,而數據挖掘就是要檢索出信息中隱晦的和未知性的但潛在有用信息的程序化過程。
提及大數據就不得不提到云計算,二者的關系密不可分,大數據的計算需要采用分布式架構,運用云計算綜合進行處理,海量信息的分布式數據挖掘需要依托云計算的處理技術。大數據的“大”字并不在于為了掌握龐大的數據信息,而是對所收集的數據進行專業化的處理,從而提高數據的有用性,實現產業增值。因此,可以定義大數據就是在一定的時間范圍內,有效的收集和捕捉信息,運用常規的工具分析和處理集合數據,是需要新處理模式才能具有更強的決策力、洞察發現力和優化能力的海量、高增長率和多樣化的信息資產。
大數據時代下的數據挖掘具有以下四個特征:
(1)應用性:這是數據挖掘區別于其他交叉學科的一個重要特征,數據挖掘產生于實際的生產生活中的應用需求,數據挖掘中的數據來自于應用實踐,同時又服務于應用實踐,將最合理的算法應用于實踐中,并在實踐中檢驗算法的準確性。
(2)工程性:數據挖掘的步驟繁瑣就決定了其工程化的特征,數據挖掘不是單一的數據分析和應用,實踐其應用性的過程當中需要準確的數據管理和準備,數據的處理和轉換,以及最后成果的驗證和使用的完整過程。
(3)集合性:一個具體的應用數據往往涉及多個功能,探索分析和關聯性探索,分類預測和聚類分析都需要諸多功能的支持,
(4)交叉性:數據挖掘更側重應用,這是其區別其他交叉學科的重要標志,統計學和人工智能等學科都與數據挖掘覺有關聯性,也正是學科之間的關聯性為自身的發展提供了一定的技術支持。
2.數據管理數據挖掘中大數據現有應用問題
2.1應用深度不足
隨著大數據開始進入人們的視野,人們看到了其對信息服務質量的有效提升,初步應用于檔案管理之中大數據也存在一定的不足,首要的問題就是現有的應用缺乏應有的深度,過分的依賴數據分析而片面的忽視了人的作用,大量的依賴大數據技術片面的忽視了大數據技術應用的最終目的是優化服務。
2.2應用技術水平不足
目前對于大數據技術掌握的高端人才是社會上比較緊缺的,大多數檔案管理人員對于技術層面是一知半解的,熟練掌握需要集中培訓或者長時間熟練,因此在現階段的應用中很難達到預期的效果,處于探索時期的應用需要得到重視。
2.3應用風險評估不足
大數據技術的應用雖然有效的提升了檔案管理的數據挖掘水平,但是應用的同時還是有一定的風險的,潛在的安全風險在數字記憶這個部分是難免存在的,一旦收到黑客的攻陷,核心數據的泄漏是毀滅性的,這樣會導致檔案的數據流失,這會滋生一系列的問題。
3.大數據技術全面應用改進的必要性
數據挖掘中的大數據應用主要是利用技術提供信息化的手段,隨著檔案信息數據的規模擴大,在對檔案信息進行存儲和查詢的過程中,及時的分析顯得尤為重要,傳統的方式顯然不能滿足現有的需求,海量的數據是傳統的方式不能理性處理的,大數據通過云計算盡性分析,從龐大的數據中將其運算能力最大程度的發揮,能從中得出有效的信息結論,智能化的處理能有效的為檔案的管理提供決策,從而能更好管理檔案,滿足不同層面客戶不同需求,最終能有效的提升檔案管理的數據挖掘水平,優化檔案管理的質量,因此,大數據的應用顯得必要性十足。
面對現有的大數據應用中的問題,我們很容易看到其中的問題,但是也不可否認,大數據技術本身的有點也是十分明顯的,面對問題,我們應對的方式無非就是最大程度的發揮其優勢,最小化其劣勢,但也不能規避問題,而是應該正面理性解決不足。現有的應用水平是必須直視的,檔案管理人員作為管理的主體,必須要有自身意識,大數據技術的應用要盡可能的提高數據的深度和維度,數據量的積累,數據挖掘的速度,數據的種類,數據的真實性都需要維度的積累,所說的數據量的維度指的是,數據量的積累的同時還需要加強對數據的應用,這能一定程度上提升數據量的深度;數據挖掘速度的維度指的利用大數據來提高檔案中數據的查找速度,對檔案進行迅速的歸類和整合,能有效的對信息數據進行挖掘;數據種類的維度指的是檔案的分類合理化,利用軟件有效的處理檔案信息對數據資源進行集中分析;數據的真實性維度指的是在冗雜的數據當中,應用大數據技術摒棄信息錄入中的錯誤信息,將真正有價值的信息挖掘出來。
現有的技術應用水平是備受爭議的,堅持大數據理念的應用,利用大數據技術對現有的檔案信息進行全面的深度挖掘,大量的數據技術能夠建立數據檔案庫,同時要切實加強數據的收集整理工作,在深度分析的基礎上,不斷的擴充信息庫的有效內容,這樣能有效的全面的應對服務過程中的個性化的需求。建立智能化的信息平臺也顯得很有必要性,能更高的豐富檔案庫的信息。不難發現,在提及大數據技術的時候,我們提到了云計算技術,二者之間的關聯性不言而喻,因此,云計算技術的應用也需要與大數據做到有效的結合,云計算的優勢是在信息數據處理中發揮作用,這是大數據產生的重要途徑,云計算技術同時可以作為大數據基礎框架建構的載體。因此,只有加強云計算技術的應用才能提升檔案管理服務端的客戶體驗。云計算技術能加強對大數據的分析和預測,并設計出具有針對性的解決方式,云計算技術的應用能夠一定程度上對潛在的風險進行分析和處理,再此基礎上能有效的建立風險評估機制,從而更好的在檔案管理的過程中規避風險,避免檔案數據流失造成的一些列不必要麻煩。
大數據技術的應用已經成了當今時代背景下的一個必然趨勢,因此為了更好促進其與檔案管理中的數據挖掘就需要我們在檔案管理中,注重應用深度和我維度的拓廣,加強應用水平和云計算技術的應用能有效提升和優化檔案管理的數據挖掘。
參考文獻
[1]董潔,信息時代高校人事檔案管理的研究[D],山東大學2008
[2]喬瑞花,檔案管理在大數據背景下面臨的挑戰和對策分析[J],科技創新,2015
[3]鐘靜,探析大數據時代背景下的檔案管理[J],蘭州世界,2014