[摘 要] 數據挖掘技術應用于中職德育管理中,可以加快尋找和建立數據的聯系,提煉出具有價值的信息。將該技術有效應用于管理系統,可以對該系統進行整體掌握,合理地建立中職德育管理機制,有效發揮德育管理系統的積極作用。首先就數據挖掘技術進行簡單的概述,進而詳細闡述了數據挖掘在德育管理系統中的應用。
[關 鍵 詞] 數據挖掘;中職德育管理;數據信息
[中圖分類號] G717 [文獻標志碼] A [文章編號] 2096-0603(2016)12-0134-02
前階段,競爭日益加劇,中職學校進行了淘汰、升級。現階段,多數學校已經具備校園網,配套建設了相應的數據管理系統,比如,政務管理系統、工資管理系統等。但是德育管理仍處于紙質管理狀態,更為嚴重的是根本不存在任何參考文獻,對于學生的成績以及德育只是教師主觀的、隨意的判斷。部分學校具備德育管理系統但是沒有進行有效的應用,使其積極作用無法充分發揮,不利于人才的培養,不利于學校德育、教學的發展。文章對數據挖掘進行闡述,進而探究數據挖掘在德育管理中的應用,希望給學校管理人員一定的幫助,促進德育管理的有效發展,更好地引導和教育學生,提高德育的轉化率。
一、數據挖掘
(一)數據挖掘的技術定義
數據挖掘其實就是在數據庫中提取具有價值的信息,比較智能而且方便,提取也是具有一定規則的,所謂的規則模式表示的是散落在數據倉庫中以及海量信息背后的知識。而數據挖掘則是從這些大量的、混亂的、無規則的、殘缺的信息中,提取潛藏的,我們無法預知的、但是具有價值和意義的知識的過程。知識又是什么,從廣義的角度講,數據和信息均屬于知識的類型,但是,我們往往把實施看作規則、模式、約束、含義等。數據是知識的來源,利用知識,發現進而有效管理信息,進一步優化查詢,有利于作出正確的決策,有利于管理流程的控制,同時通過知識的發現,促進了對數據的維護。數據挖掘屬于數據庫搜索數據的子步驟,而知識發現一共涵蓋以下幾個步驟,其一,數據清理,其二,數據集成,其三,轉換數據信息,其四,數據挖掘,其五,測評模型和描述知識。
(二)數據挖掘的技術特點
1.數據挖掘的對象是規模巨大的數據,數量級能夠達到GB、TB,還可以更大。
2.數據挖掘的通常的規律查詢是德育部門非常隨機性的查詢,無法提前提出準確的要求,而是單純依賴系統查詢,獲得認為有價值的知識。
3.在部分應用中,數據變化極快,這就需要數據挖掘可以非常快速地進行反應,提出及時的決策支持。
4.在挖掘數據的過程中,統計數據具有一定的規律性,為規則的發現提供了良好的前提。所以,挖掘的規則可以同數據庫中的數據不相適用,一旦數據處于某一臨界值時,則是有效的。所以采用數據挖掘還可以找出更多的規則。
5.數據挖掘找出的規則單純表示當下的數據庫所呈現的規則,由于該規則具有一定的動態性,一旦有新的數據添加進來,就必須對其規則進行重新計算。
二、數據挖掘在中職德育管理中的運用
數據挖掘所需要的技術有很多,文中集中對決策樹分類分析算法進行闡述。該技術方法所使用的最具代表性的算法是ID3算法,基于該算法還可以演化出C4.5算法,后者算法不僅含有前面算法的功能,同時也具備一些拓展功能。本文采用功能相對多的C4.5算法。決策樹屬于二叉樹,類似于流程圖的倒樹結構,根節點表示了各種數據,按照所選的性質遞歸決策樹,同時把相關信息分析形成一個個子集,而這些子集和初期的具有可預測性的狀態非常相似。決策樹上的節點都表示輸入屬性值一次測試,每條邊數據測試結果。每拆分決策樹,都對相應的屬性值影響可預測值的情況進行分析,如此循環下去,直至終止條件,由此形成決策樹。總而言之,二叉樹建設的核心是貪心算法,較之其他算法,其自身具有一定的特點:使用二叉樹算法可以快捷地建立挖掘模型,而且該模型描述解釋起來比較簡單。為就某特設的項目進行分類,著手于二叉樹的根節點,利用判斷,順著分支一直向下直至樹的葉子節點,這樣的路徑可以視作一種分類規則,這也就成為一個決策。二叉樹屬于表現較為直觀的分類模式。該樹有三個組成部分,其一,決策根節點,其二,根和葉子節點二者中間建立的路徑分枝,其三,葉節點。根節點位于樹的頂端部位,屬于二叉樹的開端,決策節點代表的是分類對象的屬性,在建立二叉樹的過程中,各個新例必須遍歷二叉樹,也即必須從根節點按照順序和實例與節點進行對比,當二叉樹的葉節點獲得了新屬性的時候必須終止比較。在進行分支建立的過程中,為所有的字段選擇不一樣的取值,以上在二叉樹中起著關鍵性作用。選擇各異的字段值,最后獲得子集也是存在差異的,由此對二叉樹的生長情況產生影響,成功的取值及可以加速二叉樹生長,還可以獲得理想的規則信息。必須首先活動數據才能獲得取值,該數據不僅具有一定的屬性,具備一定的獨特性質。此數據知識的搜索歸納在于對下步行為進行評價預測,并在此基礎上,深層次對德育教育進行研究。這種的德育管理存在的數據都具備以下相關特點。
(一)數據的隱私性
學生的基本信息,個人狀況以及家庭背景,尤其是父母的具體信息包含部分隱私內容,而這部分隱私內容會導致學生受到侵害,違紀現象頻發。因此,學生必須對學生的隱私進行絕對保密,保障管理系統具有絕對的安全、可靠。
(二)數據的不完整性
建設德育系統內包含的信息也許不能包含所有研究需要的一切數據。另外,人為的原因也會對數據記錄造成一定的影響,使其出現偏差或者不完整的情況。團委以及宿管負責人員在對違紀項目評定的過程中,應當保證絕對的公平公正,減少主觀因素的影響,否則會對學生信息的安全形成影響。成功的取值是表示決策樹按照這一數值實行分裂時獲得子集信息和預測信息要盡可能相同。通常來說,使用“熵”對系統的平均信息量進行表示,按照其理論對分支之后數據優劣情況進行分析評估。熵,公式里的Pi表示劃分子集對應的測試屬性的可能取值。子集的經歷路徑由熵值具體的數值所決定,假如子集的熵值偏低,子集具備的純度就會提高,反之,熵值很大,經過劃分的子集數據缺乏足夠的一致性。所以,要求隔離計算樣本子集對應的熵值,而后算出的數據中,熵值最小所指的信息字段對應的屬性值可以選作對象,這樣就能夠獲取更好的取值目標。因此,可以按照不同的取值對樣本集進行劃分,進而就分裂后的分支對應的樣本子集進行分散,逐層核算具體的熵值,采取各種方法,獲得最佳的取值目標。決策樹含有許多形式的算法,其中心理念是輸入預設值,也就是訓練集,利用決策樹算法分類分析上述訓練集,形成一個二叉樹,進而對詳細分析該樹,獲得研究人員所需要的預測情況和目標。
文章通過讀數據挖掘技術的研究,闡述了數據挖掘的相關特點,繼而有效地在中職德育管理中高效應用數據挖掘技術,對學生相關德育信息進行高效處理,繼而提取具有一定價值的信息,用于學校以及老師做出德育管理決策,其理論和現實意義非常重要。但是因為時間有限,在傳統系統中應用新技術經驗比較缺乏,部分功能不能得到完全的發揮,不利于學校的德育管理工作開展。
參考文獻:
[1]林敏.數據挖掘在中職德育管理中的應用[D].湖南大學,2014.
[2]李桂榮.數據挖掘技術在中職教學評估中的應用研究[D].廣東技術師范學院,2012.
[3]張穎.數據挖掘技術在中職學校學生德育行為分析的研究與應用[D].福建師范大學,2014.
[4]祝瑋.數據挖掘技術在中職院校教學質量管理中的應用[D].河北工業大學,2015.