史鳳波


摘要:在數據挖掘中,應用關聯規則可以挖掘一個事物和其它事物之間存在的相關性。本文使用“基于布爾矩陣的Apriori算法”來分析課程之間的相互關聯,進而為教務管理者提供準確的決策支持。
關鍵詞:數據挖掘;關聯規則;Apriori algorithm
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)10-0099-02
2 使用關聯規則對學生成績進行分析
2.1 確定挖掘對象和目標
本應用的目標是根據學生的期末考試成績,分析這些課程之間的相關性,發現類似“高等數學成績優秀進而C語言成績優秀”這樣的關系。從而指導教務管理者安排教學計劃[3]。
2.2 數據準備
(1)數據選擇。是根據所確定的挖掘對象和目標,選擇相關的數據,形成目標數據。(2)數據預處理。取自不同系統的目標數據在類型、度量等很多方面可能存在差異。其主要工作是對噪聲數據、不完整數據、不一致數據進行再處理。(3)數據變換。是為課程的不同等級設置相應的代碼,這里用x1、x2、x3、x4、x5分別表示Photoshop平面設計的成績優秀、良好、中等、及格、不及格。同樣y1、y2、y3、y4、y5表示網頁制作的成績等級,z1、z2、z3、z4表示多媒體課件制作的成績等級。應用相應代碼將數據轉為事務數據庫。
首先將連續的數值型數據轉換為布爾型數據,以適合數據挖掘的需要。用相應代碼將連續型數據轉換成布爾型數據。轉換后部分數據描述如圖1所示。
2.3 數據挖掘
這里用改進的、基于布爾矩陣的Apriori算法進行挖掘。
(1)產生頻繁項集。設最小支持度為0.06,通過對處理后的布爾矩陣數據進行計算,得到結果如圖2所示。
(2)生成關聯規則。在第一步找出頻繁項集的基礎上就可以產生關聯規則了。
如果設最小置信度為0.06,則可輸出以下的關聯規則,如表1所示。
2.4 結果評估與知識整合
從產生的關聯規則可以看到,三門課程之間存在著一定的聯系:規則1:《網頁制作》、《Photoshop 平面設計》兩門成績都在90分以上的同學,《多媒體課件制作》成績為90分的可能性是63%。規則2:《網頁制作》成績在80到90分之間,《Photoshop 平面設計》成績在90分以上的同學,《多媒體課件制作》成績在80分到90分之間的的可能性是79.5%。規則3:《網頁制作》成績在70到80分之間,《Photoshop 平面設計》成績在90分以上的同學,《多媒體課件制作》成績在80分到90分之間的的可能性是76.5%。
通過以上規則可以看到,《網頁制作》、《Photoshop 平面設計》這兩門課程對《多媒體課件制作》課程是有一定的影響的。所以,應先開設《網頁制作》、《Photoshop 平面設計》課程,再開設《多媒體課件制作》課程。
3 結語
學習是個循序漸進的過程,課程之間存在著一定的關聯與前后順序關系,課程開設的前后順序影響著學生對知識的掌握。如果教務管理者了解課程之間的這種關系,那么,他們所做出的決策也就有了客觀依據,所制定的教學計劃勢必能夠更好地指導教學工作,進而達到提高教學質量和學生對知識的掌握效果的目的。
參考文獻
[1]范明.數據挖掘導論[M].北京:人民郵電出版社,2007.
[2]陳文偉,趙新翌.數據挖掘技術[M].北京:北京工業出版社,2007.
[3]陳曉玲,李宏,張爭.關聯規則在學分制成績管理中的應用[J].湖南科技學院學報,2008,(8):106-108.endprint