任鴿 楊勇



摘要:傳統(tǒng)的高校成績預警系統(tǒng)是根據(jù)學生未完成學分績提出預警,不能做到真正的預測。近年來,隨著人工智能領域取得的巨大發(fā)展,將人工智能與高校的管理相結(jié)合已經(jīng)成為了一個未來的發(fā)展方向。為了了解到學生以往成績和未來成績之間的關聯(lián),建立基于BP神經(jīng)網(wǎng)絡的高校學生成績預測模型,探討B(tài)P神經(jīng)網(wǎng)絡在高校學生管理領域的應用。結(jié)果表明,BP神經(jīng)網(wǎng)絡能有效提高學生成績預測的精度,以及應用于學期多門課程的成績預測上的可行性。
關鍵詞:成績預警;BP神經(jīng)網(wǎng)絡;相關系數(shù)
中圖分類號:G434;TP18? ?文獻標識碼:A? ? ?文章編號:1007-9416(2020)10-0000-00
0引言
隨著教育大數(shù)據(jù)的不斷積累,如何從海量的教育數(shù)據(jù)中挖掘有用的信息成為近年來數(shù)據(jù)挖掘領域的熱點研究之一[1]。教育大數(shù)據(jù)的挖掘可以為學校教學質(zhì)量提高,人才培養(yǎng)方案的評價等方面提供依據(jù),具有很重要的理論研究研究價值和實際應用價值,越來越多的學者開始關注數(shù)據(jù)挖掘技術(shù)在教育教學領域的應用[2]。教育數(shù)據(jù)挖掘是指用數(shù)據(jù)挖掘技術(shù)分析從大量教學數(shù)據(jù)中自動檢索并整理統(tǒng)計出相關信息的數(shù)據(jù)分析過程,發(fā)現(xiàn)教學數(shù)據(jù)中潛在的有效信息,以解決教學實踐中的問題,為教學管理者、教師、學生等教育領域相關人員提供教學建議和理論支持。學生成績預測是教育數(shù)據(jù)挖掘中的重要內(nèi)容。
目前已經(jīng)有很多學者對學生成績預測做了研究。葉澤俊[3]采用基于C5.0算法的決策樹分類方法對非英語專業(yè)學生四級通過概率進行預測。劉艷杰[4]利用貝葉斯網(wǎng)絡的結(jié)構(gòu)學習的到學科之間的關聯(lián)性,基于貝葉斯網(wǎng)絡拓撲結(jié)構(gòu)學習網(wǎng)絡參數(shù),最后通過聯(lián)合樹算法給出成績預測。張燕[5]提出一種基于樸素貝葉斯的英語成績預測模型,以某職業(yè)院校2016、2018的英語四級考試成績作為基本數(shù)據(jù)來源,采用樸素貝葉斯模型中概率對不同屬性下的學生英語成績進行預測。甘才軍[6]設計并實現(xiàn)了一種可針對學生實 驗課程成績進行主動式預警的系統(tǒng),該系統(tǒng)根據(jù)學生以往實驗報告及教師批閱信息,利用貝葉斯分類器對學 生實驗課程最終考核成績提前作出預測并及時發(fā)出預警,以督促學生在課外更加主動地學習。王婧妍[7],吳興惠[8]用隨機森林算法來提高成績預測模型的精度。申航杰[9]提出了一種融合模糊聚類和支持向量回歸的成績預測方法。陳曦[10]提出了一種基于課程知識圖譜的預測算法。張昊[11]使用遞歸神經(jīng)網(wǎng)絡(RNN)中的一種變體雙向門控單元網(wǎng)絡(Bi-GRU)來預測學生成績。
為了提高學生成績預測的精度,本文提出了建立BP神經(jīng)網(wǎng)絡模型來預測學生成績。
1 BP神經(jīng)網(wǎng)絡成績預測
圖1為 BP 神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu),包含輸入層、隱藏層與輸出層,若輸出層得不到期望輸出則轉(zhuǎn)入誤差反向傳播,根據(jù)預測誤差調(diào)整神經(jīng)網(wǎng)絡的網(wǎng)絡權(quán)值、閾值,以期逼近期望輸出[12]。BP神經(jīng)網(wǎng)絡具有很強大的描述非線性函數(shù)的能力,而且一個3層的BP神經(jīng)網(wǎng)絡即可模擬任意復雜的非線性問題[13],對于這種數(shù)據(jù)預測問題能取得較好的結(jié)果。
如何設計隱藏層的神經(jīng)元節(jié)點數(shù)是BP神經(jīng)網(wǎng)絡中的關鍵問題,如果設計的節(jié)點較少則不能夠很好的逼近模擬的函數(shù),不能夠獲得準確的結(jié)果。如果設計的節(jié)點數(shù)過多會使網(wǎng)絡變得更復雜,算法訓練的時間會大大增加,算法的效率會降低。一般情況下,隨著隱藏層的節(jié)點數(shù)的增多,模型的誤差會出現(xiàn)先下降后升高的趨勢,所以確定合適的節(jié)點數(shù)非常重要,通常隱藏層節(jié)點數(shù)量確定可以通過試湊法[14]和公式1和公式2確定:
l<(m+n)+a? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 公式1
l=2m+1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?公式2
其中,l為隱層節(jié)點數(shù),m為輸入層節(jié)點數(shù),n為輸出層節(jié)點數(shù),a為0-10的常數(shù)。
2數(shù)據(jù)采集
本實驗的數(shù)據(jù)來自新疆師范大學2010屆到2018屆軟件工程專業(yè)的有不及格記錄的256名學生八個學期的期末考試總評成績,選取有核心課程的七個學期,核心課程的選取如表1所示。
針對采集的原始數(shù)據(jù),做數(shù)據(jù)預處理。對于缺考的學生成績數(shù)據(jù)替換為該課程所有學生取得分數(shù)的均值。
3 BP神經(jīng)網(wǎng)絡實驗分析
用BP神經(jīng)網(wǎng)絡進行學生成績預測過程中,我們首先將八個學期的學生課程成績分為學習樣本與測試樣本,通過學習樣本訓練BP神經(jīng)網(wǎng)絡,將學習樣本中的基礎課程成績設置為神經(jīng)網(wǎng)絡的輸入項,目標課程成績設置為輸出項,利用反向傳播算法訓練神經(jīng)網(wǎng)絡模型,確定各個節(jié)點的參數(shù)。得到訓練好的BP神經(jīng)網(wǎng)絡模型后,在預測學生成績時,將基礎課程成績代入訓練好的模型中,即可預測得出學生的目標課程成績,實現(xiàn)對學生成績的預測。
為了加強BP神經(jīng)網(wǎng)絡的實際預測功能,得到不同學期,不同科目的預測結(jié)果,建立多輸出的網(wǎng)絡模型。輸入是學生已完成的所有科目的分數(shù),輸出是對應下一學期的所有科目成績。例如,通過第一學期的成績數(shù)據(jù)來預測第二學期的成績,通過第一,第二學期的成績來預測第三學期的成績,以此類推。相對于十分精確地預測學生的分數(shù),預測學生的成績能否及格往往更重要。因此模型的預測學生及格準確率能達到一定要求,就能說明模型的實用價值。因此,在預測學期多門課程的多輸出模型下,預測的不是成績數(shù)值,而是及格與否。
程序運行在tensorflow2.0.0的框架下,使用Adam優(yōu)化器,學習速率決定了訓練過程中的權(quán)值變化,一般情況下選取較小的學習速率保證學習的穩(wěn)定性,因此這里取學習率為0.0001。輸出層經(jīng)過softmax函數(shù),得到概率最大的值的序號作為預測成績。
經(jīng)過100次迭代后得到的預測準確率如圖2所示。橫坐標是迭代次數(shù),縱坐標是預測的準確度。從圖中可以看出,各學期的預測準確率在70%到100%左右波動,其中,由于第八學期課程樣本數(shù)量較少,所以預測準確率在10次迭代后就達到了100%,預測準確率最低的第六學期也達到了70%。
4結(jié)語
為了了解到高校學生以往成績和未來成績之間的關聯(lián),建立了基于BP神經(jīng)網(wǎng)絡的高校學生成績預測模型,通過學生以往的成績數(shù)據(jù)來預測未來成績。實驗數(shù)據(jù)表明,用BP神經(jīng)網(wǎng)絡來預測學期多門課程的平均準確率能達到70%。
參考文獻
[1] 張志剛.教育數(shù)據(jù)挖掘研究與探索[J].長春師范大學學報,2020,39(2):34-36.
[2] 劉邦奇,李鑫.智慧課堂數(shù)據(jù)挖掘分析與應用實證研究[J].電化教育研究,2018,39(6):41-47.
[3] 葉澤俊.基于數(shù)據(jù)挖掘的大學英語四級通過率預測建模研究[J].長春師范大學學報,2019,38(12):55-62..
[4] 劉艷杰,李霞.基于貝葉斯網(wǎng)絡的學生成績預測[J].山東理工大學學報(自然科學版),2019,33(5):75-78.
[5] 張燕.基于樸素貝葉斯的英語成績預測模型構(gòu)建研究[J].自動化技術(shù)與應用,2019,38(10):67-69+88..
[6] 甘才軍.主動式實驗課程成績預警系統(tǒng)及其效果評估[J].軟件導刊,2020,19(5):128-131.
[7] 王婧妍,張玉飛,徐卓.基于特征選擇優(yōu)化的學生成績預測[J].智庫時代,2020(1):124-125.
[8] 吳興惠,周玉萍,邢海花.利用隨機森林算法對學生成績評價與預測研究[J].電腦知識與技術(shù),2020,16(4):254-255+258.
[9] 申航杰,琚生根,孫界平.基于模糊聚類和支持向量回歸的成績預測[J].華東師范大學學報(自然科學版),2019(5):66-73+84.
[10] 陳曦,梅廣,張金金,等.融合知識圖譜和協(xié)同過濾的學生成績預測方法[J].計算機應用,2020,40(2):595-601..
[11] 張昊.一種基于神經(jīng)網(wǎng)絡的學生成績預測方法[J].遼寧師專學報(自然科學版),2019,21(3):94-96..
[12] 周正思,劉林,程鵬.基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的GIS設備放電故障診斷[J].電氣開關,2016,54(3):37-40.
[13] 吳蓓.基于決策樹算法的成績預測模型研究及應用[D].西安:西安理工大學,2019.
[14] 岳琪,溫新.改進GA-BP神經(jīng)網(wǎng)絡在高校教學質(zhì)量評價中的應用[J].黑龍江大學自然科學學報,2019,36(3):353-358..
收稿日期:2020-08-17
*基金項目:新疆維吾爾自治區(qū)高校研項目“基于圖數(shù)據(jù)庫的危安人物知識圖譜構(gòu)建研究”(XJEDU2016S066);新疆維吾爾自治區(qū)教學改革與研究項目“基于大數(shù)據(jù)的高校學生學業(yè)成績預警分析”(ZJG2019-11)
作者簡介:任鴿(1986—),女,河南蘭考人,碩士,講師,研究方向:數(shù)據(jù)挖掘,自然語言處理;楊勇(1979—),男,陜西漢中人,博士,副教授,研究方向:知識庫自動構(gòu)建、語義消歧研究。
The Application of BP Neural Network in Early Warning of College Students' Performance*
REN Ge,YANG Yong
(College of Computer Science and Technology,Xinjiang Normal University,Urumqi Xinjiang? 830054)
Abstract:The traditional college achievement early warning system is based on the students unfinished credits, which cant make a real prediction. In recent years, with the great development in the field of artificial intelligence, the combination of artificial intelligence and university management has become a future development direction. In order to understand the relationship between students past performance and future performance, a prediction model of College Students performance based on BP neural network is established, and the application of BP neural network in the field of college students management is discussed. The results show that compared with the correlation coefficient method, BP neural network can effectively improve the accuracy of students performance prediction and the feasibility of applying it to multiple courses in the semester.
Keywords: performance warning; BP neural network; correlation coefficient