狄曉嬌
摘 要:信息技術的發展及應用以及如何利用信息技術提高高校的管理水平,是高職院校面臨的重大課題。在學習和工作的過程中接觸到數據挖掘這一先進的概念,力圖通過數據挖掘從學生的成績中找到隱含在其中的有效信息,這樣既可以幫助老師了解學生的學習情況,又可以幫助學生了解學習重點,達到教學相長的目的。利用數據挖掘技術中的決策樹的相關知識和方法,以多屆學生的《計算機應用基礎》成績,對學生的成績進行分析。主要使用數據挖掘中的決策樹知識將決策樹應用在學生成績數據挖掘的模型上,使用SPSS Modeler 軟件利用C 5.0 算法分析出哪些因素對于《計算機應用基礎》考試的影響最大,揭示其中規律,為今后教學工作及教學安排提供有效的科學的指導依據。
關鍵詞:數據挖掘;考試成績;決策樹;關聯規則
中圖分類號:G4 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2018.17.083
1 決策樹的基本概念
在已有的大量源數據中得到有效的分類器有許多種辦法,決策樹就是其中一種有效的辦法。他在數據挖掘中尤其在數據分類領域中應用十分廣泛。決策樹算法主要是通過一組輸入樣本數據然后對樣本進行決策樹歸納的一種方法。決策樹的表現形式是一個倒樹狀結構圖,并且在樹枝的節點上一般還附帶概率結果,它是一種是直觀的使用統計概率來分析對象的圖表示方法。
2 幾種常用的決策樹算法
常見的算法有CHAID、CART、Quest和C5.0。判斷決策樹算法是否合適,就看每一個決策樹分組的組之間的差別是否夠大,屬性差別越大就是算法越合適。……