劉小桃 林延慶
摘 要: 在高校教務管理工作中,對學生的成績進行管理分析是基礎與核心。通過對學生成績的分析,得出學生實際學習狀況與教師的教學情況,反映高校的教學質量。近年來,教育事業不斷改革與發展,學生人數逐年增多,每年高校都將學生的信息進行存放,而這些信息一般只用于核對與備案,造成嚴重的信息浪費。利用數據挖掘技術,對學生的成績進行挖掘分析,進而得到潛在影響學生成績的因素,并以其指導高校管理工作,指導教師教學工作,意義重大。本文針對數據挖掘在高校學生學習成績分析中的應用進行了探究,旨在提高高校教學質量。
關鍵詞: 數據挖掘 成績分析 教務管理工作
在我國高校的教務管理中,采用的基本都是基于數據庫的系統軟件。教務軟件中存有大量的學生數據,但一直沒有發揮數據的作用,可利用數據挖掘技術,從中挖掘出隱藏的重要信息,用以指導教學工作。隨著數據挖掘技術的成熟,應用的范圍不斷擴大,越來越多的高校采用數據挖掘技術指導教務的管理工作,為教學工作提供參考。
一、數據挖掘技術涵義
(一)數據挖掘的概念
數據挖掘是一種數據處理技術,一般是指在大量數據中,通過算法發現數據中隱藏信息的過程,從屬于數據庫的知識發現。數據庫利用統計、情報檢索、專家系統、在線分析處理、機器學習等方法與工具,對繁雜的數據進行分析、歸納與總結,通過搜索數據的內部信息,為高校的教務管理提供決策依據。
(二)數據挖掘的過程
數據挖掘過程是一個需要循環往復的過程,要做到精益求精,如果經過一次的數據挖掘沒有得到有效的信息,就要重新進行數據的選擇和處理,直到得出對我們有用的信息為止。一般情況下數據挖掘分為五個階段:一是了解數據挖掘的概念,明確其目的;二是做好數據挖掘的準備工作;三是數據挖掘有很多種方法,依據實際情況選擇合適的算法,對要處理的數據進行數據挖掘;四是對數據挖掘得出的信息進行分析,給予用戶能夠接受的知識;五是將通過數據挖掘得到的信息運用到對應的領域中,發揮數據挖掘的指導與參考作用。
(三)數據挖掘常用的方法
聚類分析法、統計分析法、模糊集方法、關聯規則方法、神經網絡方法、決策樹方法、覆蓋正例排斥反例法、粗集理論方法等。
二、成績分析中應用數據挖掘的方法
(一)關聯規則算法
1.應用關聯規則算法的內容。關聯規則的算法是指在大量的待處理數據中找到各事物之間的聯系,是數據挖掘中的重要課題。關聯是指在兩個事物或者兩個以上事物之間必然存在著某些規律性,運用關聯規則就是要獲取數據之間隱藏的重要信息。在成績分析中運用關聯規則,查找影響成績的因素,針對試卷得分情況,對學生的成績進行總結,分析得分情況與課程之間的相關性。
2.運用關聯規則算法的挖掘過程。一是對數據庫中的內容進行分析與識別,在進行數據挖掘之前,首先要定義最小的支持度,在最小支持度的基礎上進行原始數據的挖掘,得到的項集應不小于最小支持度;二是產生強關聯規則,利用頻繁項集產生規則,得到的規則的置信度與最小置信度相比,要比最小置信度大或者與最小置信度相等。
3.關聯規則的具體應用,下表為應用關聯規則中某專業成績不及格的挖掘規則。
依據上表得出如果最小的支持度為0.55,最小的置信度為0.35,那么1、2、4、5就為強關聯規則,在課程1不及格時,課程3與6不及格的概率就會高,這就說明課程一影響課程3與課程6;課程4也受到課程2的較大影響;課程2受到課程5的影響。
4. Apriori算法的數據挖掘。Apriori算法是一種頻繁項集算法,用來發掘相關規則。Apriori算法應用的非常廣泛,核心思想是在候選集生成與情節向下的封閉檢測的階段下,進行頻繁項集的挖掘。具體內容包括:一是依據數據挖掘的要求,建立相應的事物數據表,對于優秀成績進行保留,其他的做刪除處理;二是建立頻繁項集數據表,用A、B表示項目名稱并做相應的記錄;三是刪除表中支持度的計數小于最小的支持度記錄,從而得到最終的頻繁1項集;四是計算后幾個頻繁項目集的結果;五是刪除最終的頻繁項集中比最小的置信度閾值小的記錄,進而得到最終的規則信息。
關聯規則數據見下表:
通過置信度的計算,刪除小于最小置信度閾值的記錄,得到最終的關聯規則,見下表。
(二)決策樹算法
應用決策樹算法是將預測的內容用樹的模型表現出來,樹的根節點作為數據的結合空間,樹的分支表現每一個分類問題,作為單一的屬性測試存在,樹的葉子節點是數據分割的分類,從根節點到葉子節點的路徑就是相應的類別預測。
應用決策樹算法要收集學生的基本個人資料、學生出勤情況,以及對課程的喜愛程度、上機練習情況與基礎程度等,再結合學生的成績進行分析,得到的數據用來指導教學工作,以提高教學質量。
高校中影響學生成績的因素的決策樹如下圖:
依據決策樹得到:上機情況最為影響學生的成績,造成學生低下。教師可以決策樹得出的結論為參考,加強學生管理工作,在上機情況上加以重視,重點解決成績不理想的問題。
三、成績分析中應用數據挖掘的優勢
在學生的成績分析中應用數據挖掘技術可以有效指導教學,提高對教學有益的信息,具體內容包括:
(一)幫助學校全面掌握學生的學習情況,通過數據挖掘對學生的成績進行深層次的分析,了解學生對課程內容的實際掌握情況,便于對學生整體情況的掌握。
(二)有助于對課程相關性的分析,通過分析不同專業的核心課程,掌握學生對課程的理解程度、得分情況,進而得到課程之間存在的聯系,便于學校合理地安排課程。
(三)通過數據挖掘得到學生入學時的成績,再依據學生現在的成績,將二者結合進行分析,得到學生這一學年的學習狀況,得出課程對學生的影響,便于更好地指導學生學習。
四、結語
隨著高校的不斷發展,學生的成績數據逐年增多,運用數據挖掘技術分析學生的學習成績非常有必要。通過數據挖掘技術,發現相關數據間的聯系,從而提高分析成績效率,也在一定程度上使成績的分析結果更準確更具科學性。在實際工作中,要將數據挖掘的眾多方法結合起來運用,便于發現數據中的隱藏信息。高校要加強對學生成績的分析,提高教學質量,保證教學目標的實現。
參考文獻:
[1]朱明.數據挖掘導論[M].合肥:中國科學技術大學出版社,2012.
[2]鄭巖.數據倉庫與數據挖掘原理及應用[M].北京:清華大學出版社,2011.
[3]范明.數據挖掘概念與技術[M].北京:機械工業出版社,2012.
[4]劉美玲.樹蕨挖掘在高校教學與管理中的應用[J].計算機工程與技術,2010.
[5]王耀.淺談數據挖掘在教務管理中的應用[J].電子商務,2013.