李秀英
(甘肅省蘭州市第五中學,甘肅 蘭州 730000)
2020 年初,在教育部“停課不停學”工作部署下,廣大教師利用互聯網平臺積極開展線上教學活動,學生居家期間就能利用網絡資源自主學習,并使用在線測驗系統完成階段性學習評估。如果能從這些在線考試數據中挖掘分析、定位學生的知識掌握情況,就能為學生提供更加精準的個性化輔導。
傳統教學中,教師采用紙質試卷進行階段性學習測驗,學習效果評估僅是對學生成績進行簡單的統計分析,不能準確反映出學生個體的真實學習狀況。相比傳統紙質試卷測驗,在線測驗更容易收集一些傳統閱卷觀察不到過程性數據(答題時間、答題順序、更改次數等),對這些數據進一步挖掘分析,可以排除學生依靠運氣選對答案的情況,降低教師的主觀判而產生的誤差,從而提高學習效果評估精準度。
本文提出了一種基于BP 神經網絡的在線自學效果評估模型,可為中學生在線自主學習提供較為科學、合理的學習效果評估方法。
同一知識點在不同題型中的得分率不同,即掌握這個知識點的難易程度有所差異。其主要是學生得分的高低反映出的試題以及所含知識點的難易度。評價個體對一個知識點的掌握程度,與包含這個知識點的試題是直接聯系的,因此將其納入評價指標中。主觀題難度系數計算如式(1)所示:
v 代表試題選項數,x 表示該題答對學生數,xm代表參考學生總人數。
當學生點擊第i道題目后,開始記錄第i題答題起始時間ti1,點擊下一題選項后,記錄當前題目答題截止時間ti2,該題答題起止時間差值即為答題時間ti:
按式(3)計算每道題的答題時間。如果學生再一次對某題目進行回顧或是修改,則答題時間繼續累加。
學生答題時可能對某些選項勾選情況進行修改,更改次數是學生點擊題目選項的次數,如果進入某題答題頁面而沒有勾選題目選項,則不累加其更改次數。
學生答題時該題號會被記錄下來,每題將被重新賦予順序號,若學生對該題答案進行更改,則不會更改其賦予的順序號。本文僅將答題是否順序作為一個屬性,因此僅判斷是否為順序答題。
學生學習效果評估方法可以分為數值統計、專家系統法和神經網絡法三種,其中神經網絡更適用于非線性問題,并且評價曲線是與很多因素相關的一個非線性函數,對于抽取和逼近這種非線性函數,神經網絡是一種比較合適的方法。
BP 神經網絡,是一種利用誤差反向傳播(Back Propagation)算法訓練的多層級前饋神經網絡,適用于解決非線性模式識別和分類評價問題,是目前神經網絡中應用領域較為廣泛的一種算法。
BP 神經網絡由三層以上神經元構成的,如圖1 所示,主要包含輸入層、隱含層和輸出層,三者具有不同的作用。數據先傳進輸入層,而后在隱含層進行多層級計算,最后由輸出層將結果傳出。如果輸出結果與期望存在較大偏差,則將誤差信號沿輸出層、隱含層向輸入層反向傳播,依次調整各層級神經元之間的連接權值,不斷修正輸出層結果,使誤差信號滿足閾值范圍。輸入、輸出層神經元數由輸入、輸出數據的維度確定,隱含層神經元數的確定目前尚無明確的方法,一般由訓練結果不斷優化調整確定的。
BP 神經網絡模型設計使用多層神經元構建神經網絡模型,如圖2 所示,將知識點得分、難易程度、答題時間、更改次數、答題順序等測試數據輸入模型,利用反向傳播方法對神經網絡的權值和偏差進行反復的調整訓練,使輸出的結果與測試結果盡可能地接近,當網絡輸出層的誤差平方和小于指定的誤差時完成模型訓練,而后利用訓練好的模型對樣本數據進行預測分析,最終得到學生知識點掌握程度情況。
本文研究數據為甘肅省蘭州市第五中學八年級321 名學生在線測試物理成績,該試題共有五個部分25 道題,涉及知識點八個大類,其中客觀題21 道,主觀題4 道。在線考試過程中,每道題知識點掌握情況都以問卷調查方式詢問學生,學生點選“完全掌握”、“一般”或“未掌握”,完成知識點掌握程度數據采集。
經過數據清洗與預處理,去掉7 條未完成考試數據,共有314 條完整性較好的數據。現隨機抽取100條樣本數據作為訓練數據集,其余214條數據作為測試數據集。
知識點用大寫字母(A、B···H)表示,知識點后面的括號表示該題知識點分值,例如A(3)表示該題涉及A 知識點的分值為3 分,部分題涉及多個知識點,則該題號下分別給出了涉及知識點及分值,如表4.1 所示。


通過知識點的分值及得分計算各知識點的得分率,并提取答題過程性數據(答題時間、更改次數、答題順序)、知識點掌握度問卷調查情況,如表4.2 所示。知識點下方的數字表示涉及該知識點的題目編號。

通過該表格進一步分析各學生的知識點掌握情況。其中,“答題順序”字段中“1”表示該題為順序答題,“0”表示該題不是順序答題,“是否掌握”字段中“1”表示完全掌握,“0.5”表示一般掌握,“0”表示未掌握。
為了避免神經元的飽和性,將輸入和輸出向量設計好以后,就需要對樣本進行歸一化處理,將數據處理為[0,1]之間的數據,在此采用公式(4)進行歸一化處理。
利用式(4)分別對各知識點中答題時間進行歸一化處理,將每一個知識點答題情況看做一條訓練樣本數據,由于試題有8 個知識點,訓練數據中共有50 名學生,因此我們可得到400 個輸入參數數據,如表4.3 所示。

本文采用的BP 神經網絡模型,輸入層為5 個屬性因子(得分率、難度系數、答題時間、更改次數、答題順序),隱含層取10,輸出層為1 個預測因子(知識點掌握程度),學習速率取0.01。
根據樣本和網絡結構的特點,隱含層和輸出層的傳遞函數分別選擇tansig 和logsig,網絡訓練函數采用trainlm,網絡學習算法采用Levenberg-Marquardt 算法。該神經網絡模型訓練后需達到的要求是:單個樣本的均方誤差小于0.01,全部樣本均方誤差小于0.001,訓練過程迭代5000 次。
利用訓練好的神經網絡模型對剩下的214 名學生成績數據(即1712 條知識點測試數據)進行驗證,1645 條數據符合該神經網絡模型,即準確率為96.1%,預測準確有效。
本文利用BP 神經網絡模型對知識點掌握程度進行驗證,相對于傳統教學評估是一種新的嘗試,該方法完全可以適用于在線考試數據分析,進一步預測學生學習效果,為精準教學提供數據化支撐。下一步工作,可以進一步結合眼動技術,在考試過程中采集學生的注視時間、注視位置等數據進一步分析學生心理特征,更加準確預測分析學生知識點掌握水平及學習效果評估。