摘要:數據挖掘特有的根本理論密切關聯企業架構中的職員培訓。數據挖掘路徑下,應能建構適宜的數據庫,創設概念模型、總體架構之內的物理模型、邏輯特性的模型。對職員培訓關涉的若干信息妥善予以挖掘能辨識職員培訓特有的影響要點,縮減耗費掉的培訓金額,提升總體成效。
關鍵詞:數據挖掘技術;企業職工培訓;數據庫;概念模型;物理模型;邏輯模型 文獻標識碼:A
中圖分類號:TP311 文章編號:1009-2374(2015)10-0061-02 DOI:10.13535/j.cnki.11-4406/n.2015.0884
從現狀看,數據挖掘范疇內的技術,慣常用于金融、大規模特性的商業之中。然而,企業預設的職員培訓,較少采納這一技術。對于搜集得來的培訓信息,仍停留于建構某一數據庫、單一情形下的數據查驗。數據信息特有的決策價值,沒能充分被發覺。本文依循數據挖掘的本源原理,創設了新穎情形下的數據庫。采納挖掘手段,予以深入調研。數據挖掘得來的適宜結論,能為后續時段的培訓規劃,提供最佳指引。
1 新穎技術的特性
搜集得來的初始數據通常數目偏多,數據表征出來的不完整傾向應當被注重。原初的數據夾帶著噪聲,且帶有模糊特性及隨機特性。數據挖掘依托著的手段,是從搜集得來的最初數據以內提煉出潛藏著的、不被知曉的、帶有高層級價值這樣的信息、關聯著的知識等。慣用的挖掘方式包含關聯規則、建構好的決策樹、神經網絡及特有的貝葉斯、建構的粗糙集、對應著的模糊集、挖掘流程內的聚類分析。細分出來的挖掘步驟整合了初始時段的數據預備、數值的選取、預處理特有的流程、側重的挖掘流程、模型更替及轉變、后續時段的挖掘
評價。
數據挖掘概念。數據挖掘是從大量的、不完整的、有噪聲的、模糊的和隨即的數據中,提取隱含在其中的、人們事先不知道的、潛在的和有價值的信息和知識的過程。數據挖掘的技術最常用的數據挖掘技術主要有決策樹、關聯規則、貝葉斯、神經網絡、聚類分析、模糊集和粗糙集等。數據挖掘的步驟數據的挖掘過程主要包括5個階段:數據準備、數據選擇、數據預處理、數據挖掘、轉換模型及模式評價。
2 構建數據庫
數據挖掘特性的新穎技術不能脫離建構起來的數據庫。它能從數目偏多的信息之內提煉得來可用的數值。職員培訓特有的領域以內,數據庫可以歸整在冊范疇的一切職員,對于獲取到的關聯結果予以辨識解析。數據庫存留著的信息之內涵蓋基礎數據、培訓得來的真正
結果。
2.1 擬定物理框架
職員培訓特有的數據庫,應設定適宜情形下的物理模型。擬定好的物理模型是數據特有的存留方式、多層級的數據組織。例如:某企業篩選出來的數據庫,帶有關系型這樣的特性。搭配的管理系統設定成SQL架構下的server。建構起來的物理框架包含表1模式:
表1
2.2 擬定概念模型
職員培訓關涉的概念模型能夠明晰預設的系統界限,擬定根本主題。數據庫涵蓋著的根本信息是職員固有的自身信息、這一時段的培訓成績。歸整好的這些信息凸顯了單一性,但又潛藏著某些關聯。采納數據倉庫,提煉并歸整這樣的數值,以便提煉得來決策依憑的可用信息。依循細分出來的職員特性、建構的主題,把總體范疇內的培訓結果,分成多個層級,并歸入數據庫。
3 選出來的運用實例
3.1 采納的關聯規則
依循的評判指標,是體系架構中的置信度、對應著的支持度。必備的概率信息包含物品集特有的出現頻次。最小數值的支持度表征著篩選出來的這一項目,在統計之中凸顯了最低層級的重要價值。最小數值的置信度表征著設定好的這類規則,凸顯了不可靠的傾向。采納關聯規則,建構精準模型,以便解析某一時段的培訓狀態。
3.2 采納的模型
抽取出來的數值涵蓋固有的職員信息、測試得來的成績等。采納預設的規則,操作這些數值。這樣做能夠明晰數值潛藏著的彼此關聯,抽取得來的字段含有單位稱呼、職員個體姓名、微機處理特有的等級。
3.3 具體的挖掘步驟
預處理特有的時段中,為了辨識設定好的關聯規則,對于初始數據予以概念化。采納A這樣的符號來表征職員固有的年齡。這種情形之下,A(1)特有的信息,表示年齡沒能達到25歲;A(2)表征著年齡涵蓋在25歲至35歲;A(3)表征著年齡超出了35歲。采納H這一符號,表明測試特有的通過狀態。H(1)涵蓋著沒能通過的職員,H(2)涵蓋著通過的職員。經由離散化特有的處理以后,得來最終結果。
3.4 后續的挖掘步驟
在測試之中,職員特有的通過人數,總和5940;沒能通過的人數,總和1810。沒能通過的概率,占到了22%。采納預定的關聯規則來挖掘這樣的數據。體系范疇內的每類行為都設定了這一規則。這就表明輸入數值及對應著的輸出之間帶有偏強的關聯。
3.5 解析得來的結論
數據特有的重要性,也即興趣度,能夠辨識頻繁項、設定好的規則等。依循降序排列可以獲取明晰的規則列表。例如某次解析得來這種結論:年齡超出50這樣的職員、工齡超出25這樣的職員或者高級別范疇內的職員通過培訓概率還是偏大的。與此同時,學歷層級偏低的職員,通過等級與特有的學歷,凸顯了相關的傾向,這樣的對應符合慣常的認知。
由此可見,學歷層級偏低這樣的職員在接納新認知時能力是偏弱的。針對企業以內的這類職員,在接續的培訓之中應多加注重。設定出來的培訓形式,應符合帶有差異特性的職員群體;劃分的培訓時段應傾向于認知偏弱的職工。例如:可以添加課時,調整預設的培訓時段,保障體系以內的這些職員,能參與擬定好的培訓規劃。此外,對于接納能力偏強這樣的職工,可適當縮減原有的課時,縮減設定好的多樣科目。這樣做可縮減耗費掉的培訓經費,并創設最優情形下的整體效益。離散化情形下的數值處理驗證了歸結出來的這一結論。
4 結語
數據庫建構依循的根本原理不能脫離數據挖據。企業培訓之中,借助挖掘得來的多重信息,能夠解析各時段的培訓成果。連續值固有的屬性,在設定好的挖掘流程內得以離散化,這就為接續的深入挖掘提供了基礎。調整擬定好的培訓規劃,確保預設的新規劃,符合職員培訓特有的真實狀態。
參考文獻
[1] 黃瑛.企業數據挖掘技術在企業信息化中的應用[J].電腦知識與技術,2011,(27).
[2] 胡玉琦.數據挖掘技術在企業職工培訓中的應用[J].數字技術與應用,2011,(11).
[3] 鮑建成.數據挖掘技術在企業經營管理中的應用分析[J].電腦知識與技術,2008,(36).
[4] 盧建昌,樊圍國.大數據時代下數據挖掘技術在電力企業中的應用[J].廣東電力,2014,(9).
[5] 黃勇,曾薇,黃毅.數據挖掘技術在企業管理中的應用研究[J].福建電腦,2007,(4).
作者簡介:王靖夫(1990-),男,河南省煙草職工培訓中心培訓管理科職員,研究方向:職業培訓。
(責任編輯:秦遜玉)