楊鴻華
摘要:檔案管理工作在信息技術的推動下獲得了快速發展,將數據挖掘技術引入到檔案管理系統中是實現檔案管理目標和提升檔案管理價值的必然要求,本文在介紹了數據挖掘技術及其與檔案管理工作關系的基礎上,重點從檔案分類、檔案收集、檔案保管三個方面研究了數據挖掘技術在檔案管理系統中的應用。
關鍵詞:檔案管理系統;數據挖掘技術;應用
1引言
信息時代背景下的檔案管理模式不斷受到網絡技術和計算機信息技術發展的沖擊和挑戰,人們對信息需求具有多維性和及時性的特征,因此信息時代背景下的檔案管理模式和檔案管理系統必須滿足人們不斷增長的海量信息需求以及最大程度上縮短信息獲取的等待時間,實踐表明將數據挖掘技術引入到檔案管理系統中具有非常重要的作用和價值。
2數據挖掘技術及其應用概述
數據挖掘技術是伴隨著信息技術的革新和人工智能的發展而得到廣泛應用和不斷發展的一項技術,目前其已經在包括檔案管理系統在內的廣大領域中得到了廣泛而深入的應用,伴隨著數據挖掘技術在檔案管理系統中的應用,相關的檔案信息收集、數據處理、數據利用的速度和質量都得到了大幅度提高,大大地推動了檔案管理事業的發展。
數據挖掘技術通常使用分類法、關聯法、粗糙集法等對采集的數據進行多維度分析整合,從而得到隱藏其中的知識、規律和模式,決策者基于數據挖掘的結果進行決策可以顯著提高決策的科學性、準確性和針對性,提高對未來行為和事情的預見性。
在使用數據挖掘技術之前,必須有可供挖掘的大量數據存在,只有滿足這個前提才能使用相關的方法對數據進行分析、整理從而得到相應的結果,數據挖掘后得到的結果可以在過程控制、信息管理、數據維護、查詢優化、決策分析等方面得到廣泛的應用。數據挖掘技術及其應用同時又是一個跨學科的技術,其與人工智能技術、計算機技術、數據倉庫技術和統計學方法理論等緊密相連,同時數據挖掘技術中還會大量應用到遺傳算法、神經網絡等技術。
3檔案管理系統中數據挖掘技術的應用
檔案管理系統中數據挖掘技術的應用不僅是信息時代背景下檔案管理工作的客觀要求,同時也是新時代背景下實現檔案管理價值的重要方法和途徑。歸納綜合起來檔案管理系統中數據挖掘技術的應用主要體現在以下幾個方面:
3.1檔案分類中數據挖掘技術的應用
檔案分類是檔案管理的基礎工作,數據挖掘技術的決策樹算法可以依據一定的規則將不同種類不同屬性的檔案快速區分開來,對符合一定規則和屬性的檔案進行歸整,大大提高檔案管理員的歸類速度,提高檔案檢索速度和效率。檔案分類中數據挖掘技術的具體工作流程為:在眾多具有不同特征的數據集中挑選出訓練集,訓練集是指已經完成分類工作的數據集,基于此訓練集構建符合既定規則的分類模型,然后將該分類模型應用到沒有完成分類工作的訓練集,這種檔案分類可以幫助檔案管理者對信息用戶的特點和行為進行分類總結,并可以根據其個人愛好定制和推薦用戶感興趣的信息,諸如基于用戶的職業、性別、學歷、愛好以及瀏覽習慣等信息分析和推斷出用戶的偏好,這種基于數據挖掘的差異化和個性化分析可以幫助用戶提高獲取有效信息的速度,從而提高檔案管理的有效性和價值水平。值得注意的是要在檔案分類中正確使用決策樹算法要處理好分裂屬性的選擇和訓練數據分類的有效性。
3.2檔案收集中數據挖掘技術的應用
檔案收集中數據挖掘技術的應用主要是基于數據庫內的數據描述來構建數據模型,將數據樣本與數據模型進行對比并找出差異,如果發現測試樣本模型與構建的數據模型相吻合,那么就按照測試樣本模型的分類方法對事務進行分類。檔案收集中數據挖掘技術的應用要求對檔案信息庫進行全面分析和綜合測度以得到科學的描述方案,并對已知概念模型和相關數據集進行科學描述,然后將模型與測試樣本進行比較來檢查模型的準確程度,如果反復測試后模型表現出較高的準確性,那么就將該模型作為標準模型,這是檔案管理個性化功能實現的基礎。將數據挖掘技術應用到檔案收集中可以提高檔案收集工作的有效性,從而為后續的檔案分類和檔案信息預測工作創造良好的前提條件,這也是檔案管理個性化和功能定制化得以實現的重要保障。
3.3檔案保管中數據挖掘技術的應用
檔案保管的目的是保留用戶的檔案信息防止檔案流失。對于企業來說留住老員工的成本遠遠要比重新聘用新員工的成本要低,研究和保管老員工的檔案信息是留住老員工手段的重要方法之一,通過對老員工檔案流失記錄的分析、挖掘和整合,從中可以發現導致員工流失的原因并及時地采取補救措施,這在現代企業人力資源檔案管理中具有十分重要的地位,國內外許多大公司已經率先應用并取得了一定的成績。檔案管理活動的目標是為了滿足管理者對于檔案信息的需求,將數據挖掘技術應用到檔案日常保管管理中可以提高檔案工作的效率和效能,同時也可以將檔案管理工作與人力資源管理工作緊密結合起來。
4 結論
數據挖掘技術是現代信息化技術的重要領域,也是人工智能(AI)和商務智能(BI)領域的重要支撐技術,具有重要的實際應用價值和發展前景。檔案管理系統中數據挖掘技術的應用,大幅度地提升了檔案管理工作的效率和檔案信息查詢檢索的速度,隨著檔案管理現代化的不斷推薦、新的需求不斷提出以及計算機技術的發展,因此有必要進一步加強檔案管理工作中數據挖掘技術的應用,從而有效快捷地實現檔案管理的現代化。
參考文獻:
[1]於立勇.計算機數據挖掘技術應用在檔案信息管理系統中的探討[J].電腦知識與技術,2012(02).
[2]黃華.數據挖掘分析在檔案管理方面的應用[J].網絡安全技術與應用,2009(04).
[3]周碧珍.淺析計算機數據挖掘技術在檔案信息管理系統中的應用[J].黑龍江科技信息,2009(01).
[4]彭皖民.基于用戶檔案管理的數據挖掘分析[J].河南科技, 2008(04).endprint