湖南省湘西職業技術學院計算機系 黃 青
數據挖掘技術在學生成績管理中的應用研究
湖南省湘西職業技術學院計算機系 黃 青
在學校的管理工作中,學生成績管理是非常重要的一個環節。當前我國一些學校在對學生成績進行管理的過程中,雖然利用了相關的成績處理系統,但是對人工管理的依賴性還比較大,這種管理方法不僅工作效率低, 容易出錯,而且很難有效的對學生成績進行分析,從而獲取更多有價值的信息。如果學校能夠充分利用數據挖掘技術,可以進一步完善成績管理系統,從而挖掘更多隱秘的信息。因此本文在分析數據挖掘技術應用優勢的基礎上,還具體分析了如何才能根據數據挖掘技術設計一個合理的成績管理系統。
數據挖掘技術;學生;成績管理
我國學校主要是由教師將學生的考試成績逐一輸入到成績管理系統中,從而由該系統對分數進行分析,從而了解各分數段的人數等基本信息,但是目前所應用的系統不僅不能對得分點與失分點進行具體的分析,而且也不能對學習情況以及相關的影響因素進行分析。在信息不全面的情況下,教師就很難開展教學策略的改革,而且單純將成績存儲于系統中造成了資源的浪費,不利于解決成績管理系統問題,更是不利于教學質量的提高。
目前各大學校使用的成績管理系統存在一定的缺陷,它只能對基礎的信息進行統計,而利用數據挖掘技術后,不僅可以對及格率和優秀率等信息進行統計,而且還能對某個階段的學習成績進行分析,從而了解學生在一個時期內的學習情況以及相關的影響因素,總之,利用數據挖掘技術可以更客觀、全面的評定學生成績。同時,利用數據挖掘技術能夠了解學生在考試中到底存在哪些方面的不足,從而對學生進行針對性的學習,并了解試題的難易程度是否符合學生當前的學習狀況[1]。在此基礎上利用數據挖掘技術可以更合理的進行教學評價,從各個方面挖掘更多的信息,從而給予教師客觀、全面的評價。此外,利用數據挖掘技術能夠真實反映成績影響因素,獲取更多的有價值信息,從而有利于教師做出更合理的課程安排。
3.1 數據挖掘過程的設計
只有合理設計數據挖掘過程,才能創建一個合理的學生成績管理系統,一般來說數據挖掘較為復雜,可分為以下六個步驟:
第一個步驟是確定數據源。在整個系統的創建中,數據源是重要的基礎部分。對學生成績進行統計與分析的過程中,面向對象較為廣泛, 不僅僅是一個個體,而是不同類型的學生 ,例如,對于教務處而言,需要對全校學生的學習成績進行分析, 以便了解他們的學習情況 ,而對各個系別而言,他們需要對本系學生的學習成績進行分析,以掌握更多的相關信息[2]。他們不僅面向對象不一樣,而且數據挖掘目的也有所差異;第二步驟是選定模型。選定模型主要是指針對挖掘的問題選擇對應的方法 ,并為該種挖掘方法,選擇有效的算法,算法的選擇尤其重要,因為它直接影響著挖掘信息的質量[3];第三個步驟是采集數據。采集數據需要投入大量的精力,因此開發者在對信息進行收集的過程中,部分數據是可以直接獲取的,但是部分數據需要通過實踐調查獲取;第四個步驟是數據預處理。開發者需要對各種數據進行預處理,并根據結果創建一個分析數據模型,這是非常關鍵的一個環節,只有做好了數據預處理工作,才能有效提高信息的質量;第五個步驟是數據挖掘。數據挖掘過程中充分體現了算法的具體的應用 ,開發者將通過這一環節深入的挖掘已經經過預處理的信息[4];第六個步驟是解釋和評價。解釋和評價主要是指對挖掘結果 進行一個綜合的分析、驗證,并從中獲取真正有效的信息 ,從而將根據數據信息改進教學策略,以獲取更好的教學效果。
3.2 數據挖掘的基本方法
系統需要選擇合理的挖掘算法,這是至關重要的一步,經過對不同的算法進行比較后發現,最佳的算法有兩種。
第一種算法是關聯分析法。應用關聯分析法,主要是為了能夠挖掘出各種隱含的數據關系。在具體的應用中,需要先提供一組集合,進而對其進行統計與分析,推導出數據的關聯性 。對數據庫系統進行建設的過程中 ,可應用的關聯規則有很多,開發者需要根據實際需求進行合理的選擇。通常情況下 可根據“可信度”,或者“支持度”這樣的一個閩值,淘汰無效或者意義不大的關聯規則。同時,關聯規則算法需要遵循一定的步驟,首先,有關人員應當搜尋所有的頻繁項集,即支持度不超過最小支持度的集合;其次,頻繁項集之間形成的所有關聯規則必須要滿足最小置信度,或者滿足最小支持度[5]。在實際的教學中,教師應用以上這種方法對課程教學與成績相關性進行分析,可以獲取更多有效的信息,對于教學質量的提高具有重要的意義。
第二種算法是決策樹算法。決策樹算法是建立在實例上的一種有效方法,不僅可以用來對數學進行預測與分類,而且還可以用來對數據進行預處理與挖掘。一般來說主要由兩大部分組成:一是樹的生成,二是樹的剪枝。有關人員在利用決策樹算法對數據信息的分類規則進行挖掘的時候,主要是以“if—then”的形式表示規則使用。而且這種具有自身的優勢,從數據處理的角度來看,它的處理速度非常快,從結果的角度來看 ,分類準確率也很高,更重要的是算法可以容易轉換為 SQL 語句。
學校將數據挖掘技術應用于學生成績管理管理中,可以對學成成績進行客觀、全面的分析,從而使教師能夠全面掌握學生的學習狀況,了解學生的知識薄弱環節,從而加強對學生進行這一方面的培訓,并為課程開設提供真實的數據依據。同時,通過數據分析結果,教師可以了解教學策略存在哪些不足,從而作出相應的改變,以此有效改進教學方法。總之,數據挖掘技術的應用可以有效促進教學水平的提高,而且還能促進教學秩序的穩定,以改善學校的考風、學風、教風。
[1]劉春陽.數據挖掘技術在高校成績管理中的應用研究[D].學位論文:大連交通大學,2013,07(16):196-198.
[2]趙輝.數據挖掘技術在學生成績分析中的研究及應用[D].學位論文:大連海事大學,2014,09(16):98-100.
[3]康艷霞.數據挖掘技術在學生成績分析中的應用研究[D].學位論文:華東師范大學,2014,06(15):109-111.
[4]曲萍.數據挖掘技術在高校學生成績管理中的應用研究[J].網絡與信息,2013,10(25):80-82.
[5]劉軍.決策樹分類算法的研究及其在教學分析中的應用[J].河海大學,2015,02(16):380-383.
黃青(1983—),女,苗族,大學本科,工程碩士,湖南省湘西職業技術學院計算機系講師,研究方向:計算機應用、控制工程。