馬靜



摘要
本文闡述了利用數據挖掘軟件clementine將數據挖掘技術引入到教學管理工作之中,從教學評價的數據中提取出隱藏在數據中的有用信息,探討影響教學質量的關鍵因素,從而為教學主管部門的管理工作提供決策性參考。
【關鍵詞】數據挖掘 高職 評價模型
隨著“教育信息化”的發展,教務管理的相關數據越來越多,但這些數據除了作為歷史數據外,其有用信息的價值并未充分挖掘和利用,并使其轉化為有用的知識,實現真正的教育信息化。教務管理中的教學評價對于教育質量的提高起著十分重要的作用,而利用數據挖掘技術從教學評價數據中提取出隱藏在數據之中的有用信息可為教務管理工作提供決策性參考。數據挖掘技術是利用數據庫、數據倉庫技術存儲管理數據,利用機器學習和統計方法分析數據的一項跨學科技術。通過數據挖掘技術我們可以完成數據總結、分類、關聯、聚類等若干主要任務。為了提高數據挖掘工作效率,常借用一些工具軟件,clementine是眾多數據挖掘軟件之一,它擁有豐富的數據挖掘算法,支持與數據庫之間的數據和模型交換;同時,具有可視化操作界面,簡單易用,分析結果直觀易懂,圖形功能強大等特點。
1 教學評價模型及挖掘算法的選擇
教學評價是學校和教師、教師和學生相互聯系的一個紐帶。為了更好的完成教學評價,各院校會認真制定學生教學評價指標體系。本文研究的指標體系主要包括教學態度,基本素質,教學內容,教學方法,教學效果,教學特色六項指標。為了研究六項指標之間,六項指標與評價結果之間的關聯,本文選擇clementine的關聯分析技術進行數據挖掘。
數據挖掘中,關聯分析的主要技術是關聯規則(Association Rule),clementine提供了Apriori、GRI、Carma等多種經典關聯規則算法。本次研究選擇Apriori算法,其主要原因是:研究所涉及數據量較大,Apriori算法在提高關聯規則分析效率的同時,還能有效揭示數據中隱含的關聯特征。基于Apriori算法模型是無指導學習方法,本次研究采用web網狀圖分析報告與模型比較的方式來評價模型。
2 利用clementine對教學評價進行數據挖掘
數據挖掘的過程主要包括五個階段:
(1)數據準備;
(2)數據選擇;
(3)數據預處理;
(4)數據挖掘;
(5)轉換模型及模式評價,本文研究嚴格按照上述步驟進行。
2.1 數據準備及數據選擇
數據準備主要包含兩點:一是要根據挖掘對象收集原始數據,即確立數據源,第二是整合數據。本文數據源來源于教務系統3個學期39位教師的教學評價信息表666078條數據,其表結構如表1所示,經過數據表的聯接與篩選生成了表結構如表2所示的訓練樣本集。
2.2 數據預處理
數據預處理在數據挖掘過程中是很重要的一個環節,它可以保證數挖掘所需數據集的質量。數據預處理工作主要是對收集的數據進行清理,針對教學評價信息特點,數據預處理主要分兩步進行:
2.2.1 數據清理
數據清理工作主要是對于空缺的屬性,使用數據清理技術來填充,當記錄有多個屬性缺少屬性值時,將這些記錄將視為無效記錄并刪除。
2.2.2 屬性歸約
樣本集中用于數據挖掘的字段都是連續型屬性,由于Apriori算法及web網狀圖分析需要離散性屬性數據值,本文研究將各項評分和最后得分做了離散性的屬性劃分,其劃分規則如表3所示。
2.3 關聯規則挖掘
(1)本文利用clementine的Apriori算法和web網狀圖對教學評價信息進行了挖掘,創建數據流如圖1所示,其中partion結點的Trainingpartionsize和Testing partion size都設置為50%,Apriori算法設置其minmum antecedent support為10%,minimum rule confidence為80%。Apriori算法執行結果如圖2所示。
2.4 挖掘結果分析
(1)假設關聯規則的最小支持度為10%,最小置信度為80%,進行關聯規則挖掘產生3條強關聯規則:shuizi=“優秀”→zhongping=“優秀”(s=l1.256%c=86.519%);taidu=“優秀”→zhongping=“優秀”(s=l1.256%c=86.519%);fangfa=“優秀”→zhongping=”優秀”(s=12.1210/0c=85.579%);同時三條規則的提升值分別為1.319,1.319,1.305都可以接受。因此,基本素質,教學態度,教學方法三個指標是最直接影響最后得分評優的主要因素。
(2)教學評價的web網狀圖如圖3所示,移動下方滑塊后的網狀圖如圖4所示。可見,關聯規則和圖形展示的結論一致。
3 小結
本文主要介紹了基于學生評教信息,如何利用clementine數據挖掘工具采用Apriori算法進行建模,再利用Web網狀圖分析進行模型評價的數據挖掘過程,探索學生評價各指標與評價結果關聯性知識的方法。本文的研究只是數據挖掘應用與教學領域的初級階段,旨在為后續的深入研究做鋪墊。
參考文獻
[1]常軍林,張真.數據挖掘在高校教學評價中的應用[J].中州大學學報,2016,33(02):105—107.
[2]張超.基于關聯規則的數據挖掘在高校教學評價中的應用研究[D].安徽:安徽大學,2011.
[3]薛薇,陳歡歌.Clementine數據挖掘方法及應用[M].北京:電子工業出版社,2010:14-14.
[4]鄭靜靜.高校教學評價體系中關于學生評教的思考[J].文教資料,2013(15):162-163.
[5]紀希禹.數據挖掘技術應用實例[M].北京:機械工業出版社,2009:7-8.
[6]鄒立娣.數據挖掘技術在教學評價系統中的應用研究[D].安徽:合肥工業大學,2009:24-25.