周劍 薛景 韓崇 肖甫 孫力娟



摘? 要: 利用已有成績對未來成績進行準確預測,對提高教學質量有重大意義。文章提出了基于BP神經網絡的學生成績預測方法,并將其應用于南京郵電大學C語言課程的期末成績預測,以及某高中高考成績預測。通過對比分析,說明該方法的應用條件,驗證該方法的有效性。最后分析該方法應用于教學的具體方式。
關鍵詞: 成績預測; BP神經網絡; 大學課程成績; 高中高考成績; 教學質量
中圖分類號:G642? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2018)12-71-04
Abstract: It is of great significance to improve the teaching quality by accurately predicting future performance with existing performance. The student performance prediction method based on BP neural network is proposed in this paper. And the proposed method is applied to the final performance prediction of C programming language course in Nanjing University of Posts and Telecommunications, and the performance prediction of college entrance examination in a high school. Through comparison and analysis, the application condition of the proposed method is illustrated, and the effectiveness of the proposed method is verified. Finally, the specific application of the proposed method in teaching is analyzed.
Key words: performance prediction; BP neural network; college courses performance; college entrance examination performance;? teaching quality
0 引言
學生成績是評價教學質量的重要依據。隨著信息化技術的普及,學校教學管理系統及課程作業系統中,以電子數據形式積累了大量的學生作業成績和考試成績。如何對這些成績數據進行有效挖掘以提高教學質量,是值得研究的問題。學生因個體差異,導致學習效果會存在很大的差異[1]。如果能利用學生已有成績對該學生的未來成績做出預測,并以預測結果為依據,適當地更改教學策略并對學生進行提示[2],可以提高教學質量。
成績預測最初采用基于人工的預測方法,由教師或者科研人員人工收集數據,并根據經驗對成績進行估計。該類方法不僅工作過程復雜,而且計算量大、耗時長。隨后出現了基于數理統計的預測方法,如最小二乘回歸、灰色模型等[3-4]。該類方法采用數學建模對學生成績進行預測,然而該類方法對于非線性數據的預測能力不強,無法準確刻畫學生成績變化特點。近些年,基于機器學習的預測方法發展迅速,如貝葉斯網絡、支持向量機、神經網絡等[5-9]。該類方法具有很強的非線性建模能力。
BP(Back Propagation)神經網絡[10]是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡之一。本文提出基于BP神經網絡的學生成績預測方法,對南京郵電大學某年級C語言課程的期末成績以及某高中高三學生的高考成績進行預測。
1 學生成績數據描述
本文作者所在的南京郵電大學C語言課程組采用自主開發的網上作業平臺(https://c.njupt.edu.cn/),學生平時作業都是在該平臺上完成,因此平臺積累了大量學生作業成績數據。南京郵電大學某年級C語言課程的成績數據描述如表1所示。對于該大學課程成績,本文通過BP神經網絡,根據五次平時作業成績來預測期末考試成績。
某高中,在高考前一個多月內對高三學生進行三次模擬考試,該高中高考的成績數據描述如表2所示。對于該高中高考成績,本文通過BP神經網絡,根據三次模擬考試成績預測高考成績。
2 基于BP神經網絡的學生成績預測方法
2.1 BP神經網絡結構
BP神經網絡拓撲結構包括輸入層、隱含層和輸出層。Robert已經證明只有一個隱含層的BP神經網絡可以逼近閉區間內的任意連續函數,所以一個三層的BP神經網絡,可以完成任意的n維到m維的映射。因此,本文建立三層BP神經網絡結構的預測模型。隱含層神經元數量根據公式確定,其中ni為輸入層神經元數量,no為輸出層神經元數量,a為調節常數。
大學課程成績預測中以5次平時成績作為輸入,期末成績作為輸出,網絡結構為5-10-1,如圖1(A)所示。高中高考成績預測中,以3次模擬考試成績作為輸入,高考成績作為輸出,網絡結構為3-8-1,如圖1(B)所示。
2.2 BP神經網絡計算過程
設輸入層的輸入為已有成績x1,x2,…,xi,xno,則隱含層第j個神經元的輸出如公式1所示。其中,wij表示輸入層神經元i與隱含層神經元j之間的權值,θj表示隱含層神經元j的閾值,g()是隱含層神經元的激活函數,本文采用tansig函數。
輸出層唯一的神經元的輸出,即預測的成績如公式⑵所示。其中,wjo為隱含層神經元j到輸出層神經元o的權值,θo為輸出層神經元o的閾值,f()為輸出層神經元的激活函數,本文采用線性傳遞purelin函數。
2.3 BP神經網絡訓練過程
BP神經網絡訓練的主要目的是反復修正權值和閥值,使誤差函數值E達到最小,如公式⑶。其中,為實際的成績,為預測的成績。本文使用梯度下降法,根據使E減小最快的方向來調整權值和閥值。
本文基于BP神經網絡的學生成績預測方法總體流程如圖2所示。
3 實驗與分析
本文收集到南京郵電大學某年級424名學生的C語言課程成績作為大學課程成績預測的樣本數據;收集到某高中758名學生的高考成績作為高中高考成績預測的樣本數據。對于大學課程成績預測和高中高考成績預測,均采用70%的樣本數據作為訓練樣本,30%的樣本數據作為測試樣本。在Matlab上實現本文方法,對成績進行預測。對大學課程成績預測結果如圖3所示,對高中高考成績預測結果如圖4所示。
從圖3和圖4中可以看出,高中高考成績的預測結果優于大學課程成績的預測結果。BP神經網絡預測結果依賴于輸入與輸出的相關性。高中高考成績預測中,輸入是高考前一個月內三次模擬考試成績,且這三次模擬考試均有教師監考,因此,模擬考試成績能反映學生的真實學習效果,和高考成績相關性較大。大學課程成績預測中,輸入是一個學期內五次平時作業成績,這五次作業時間跨度較長,且無法保證是學生獨立完成的,因此與期末考試成績相關性較弱。另一方面,高中高考成績預測中樣本數量也多于大學課程成績預測中樣本數量。因此,將BP神經網絡應用于成績預測,需要有一定數量和質量的訓練樣本作為保障。
為了驗證本文方法的有效性,將BP神經網絡與傳統最小二乘回歸進行對比,預測精度和均方誤差結果如表3和表4所示。從表中可以看出,無論對于大學課程成績預測還是高中高考成績預測,本文基于BP神經網絡的預測方法均優于傳統最小二乘回歸預測方法。
本文預測方法應用于教學的具體方式如下。①如果班級中個別學生的預測成績較低,則可以找這些學生談話,敦促這些學生的學習并幫助他們改進學習方式,以期提高最后的考試成績。②如果班級中大部分學生的預測成績較低,則教師需反思自己的教學策略,改進教學方式。③該預測方法也可以應用到考試后學生成績分析,將預測結果與實際考試結果對比,對于相差較大的學生,根據實際情況分析原因,比如是由于平時作業抄襲,還是由于最后考試緊張,并以此對教學方式進行反思。
4 結束語
隨著信息技術的普及,學校教學管理系統以及課程作業系統中積累了大量的成績數據。利用已有成績,對未來成績進行預測,可以讓學生和教師對學習和教學效果進行預判,也有助于改善學生的學習方式和教師的教學策略,從而提高教學質量。本文提出了基于BP神經網絡的學生成績預測方法,詳細介紹了網絡結構、計算過程、訓練過程。通過大學課程成績預測與高中高考成績預測的對比,分析了BP神經網絡應用于成績預測的條件。通過BP神經網絡與最小二乘回歸的預測結果對比,驗證了本文方法的有效性。最后分析了該方法在教學中的具體應用方式。
參考文獻(References):
[1] 顏士剛.現代信息技術異化的根源分析及其消解的可能性[J].現代教育技術,2009.1:8-11
[2] 唐婧.數據挖掘算法在計算機教學成績預測中的應用[J].信息與電腦,2017.18:34-36
[3] 李敬文,陳志鵬,李宜義等組合預測模型在高考數據預測中的應用研究[J].計算機工程與應用,2014.50(7):259-262
[4] 劉昊.基GM(1,1)與反向傳輸神經網絡的大學生體育成績預測[J].南京理工大學學報,2017.41(6):760-764
[5] Kotsiantis S, Pierrakeas C, Pintelas P. Predicting students'?performance in distance learning using machine learning techniques[J]. Applied Artificial Intelligence,2004.5:411-426
[6] Djulovic A, Li D. Towards freshman retention prediction: a?comparative study[J]. International Journal of Information & Education Technology, 2013.5:494-500
[7] Romero C, Espejo P G, Zafra A, et al. Web usage mining?for predicting final marks of students that use moodle courses[J]. Computer Applications in Engineering Education,2013.1:135-146
[8] 張莉,盧星凝,陸從林等.支持向量機在高考成績預測分析中的應用[J].中國科學技術大學學報,2017.47(1):1-9
[9] 黃建明.貝葉斯網絡在學生成績預測中的應用[J].計算機科學,2012.39(11):280-282
[10] Rumerlhar D E, Hinton G E, Williams R J. Learningrepresentation by back-propagating errors[J].Nature,1986.323(3):533-536