鄧娜
撫州幼兒師范高等專科學校,江西,撫州,344000
為響應國家擴招政策,近年來各高職院校不斷擴大招生規模,學生數量持續上升,生源整體質量呈下降趨勢。不管是高職院校的教學管理,還是學生管理難度都大大提升了。加之由于當前網絡環境、家庭環境等外部因素,以及學生自身的自控力不足、學習態度不夠端正、學習習慣不夠良好等內部自身因素的影響,使得大學生無法通過期末考試,進而影響學生學業完成情況。因此,如何通過數據挖掘方法進行學生成績的分析及預測,對學生的學業進行預警具有十分重要的意義,不少研究學者都對學生的學業預警進行了相關研究[1]。
王凱成利用Microsoft SQL Server提供的四種數據挖掘算法,以2002級至2010級的學生歷史成績數據建立模型,并結合當前學生的成績表現預測其畢業時的平均績點,結果顯示神經網絡算法預測準確率最高[2]。宮峰運用Apriori算法挖掘學生學業成績的影響因素,運用ID3算法對學生進行分類,建立學業預警模型,并運用Weka對相關數據進行挖掘分析,為教學管理和學生管理等提供建議和數據支持[3]。
據統計某高職院校數學專業學生第一學期數學分析(簡稱“數分”)期末成績及格率為46.2%,綜合成績及格率為73.5%。本文主要以某高職院校數學專業學生的數學分析成績數據為例,對影響學生數學分析成績的幾個因素進行分析,通過統計,運用優化約簡及非線性逼近的模糊神經網絡挖掘方法對學生的數分成績進行研究[4],建立期末成績預測模型,對學生成績進行預測并做出預警,針對預警學生提供學習幫扶,提升其通過率。
要構建數分期末成績預警模型,首先要對數分成績的影響因素進行研究。潘興俠、郭琦茹和林楠在《本科生數學成績影響因素調查》[5]一文中指出,學習興趣、學習動機和學習方式對數學成績影響顯著。通過查閱文獻、咨詢相關研究學者,并結合學校的實際情況,本文從學生的數分學習興趣、數分學習行為、數分學習認識、數分自我效能感及數分作業習慣五個方面展開,對成績預測指標進行分析。
為研究數分課程期末成績預測模型,采集了某高職院校大一學生第一學期數學分析期末成績數據,共獲得377條學生數據(表1),將這部分學生數據作為成績預測初始數據源。

表1 某高職院校學生數學分析成績
對研究確定的數分成績影響指標,通過調查問卷的形式對各指標量表數據進行收集,共獲得208條數據(表2)。

表2 某高職院校學生數分成績影響指標量表
以數分成績影響的5個指標“數分學習興趣、學習行為、學習認知、自我效能感和作業習慣”作為樣本的輸入指標,以期末卷面成績作為樣本的輸出指標。首先對樣本數據進行預處理,將期末成績的5個影響指標分別模糊劃分為5個子集,分別記為1、2、3、4、5,依次代表評分等級為差、較差、一般、較好和好;期末成績也劃分為5個模糊子集,記為1、2、3、4、5,代表學生數分期末成績標簽為預警、及格、中等、良好和優秀,并剔除不全及明顯矛盾數據。部分樣本數據如表3所示。

表3 某高職院校學生數分成績數據

整個模糊神經網絡結構分為五層:
第一層是輸入層,輸入期末成績影響的5個指標因素,故這一層共有五個輸入結點;
第二層是模糊化層,本文采用高斯函數

作為各變量的隸屬度函數,將5個指標因素輸入值模糊化為對應的隸屬度表示;
第三層是規則層,本文采用約簡的規則提取方法[4],提取出5條規則前件,并計算出對應的綜合隸屬度;
第四層是去模糊化層,對第三層得到的數值進行反歸一化;
第五層是輸出層,將模糊化層的輸出轉變為最終預測的成績結果。
本文利用數學軟件工具MATLAB輔助建模,將訓練樣本和測試樣本導入系統,并進行歸一化和模糊化處理;對隸屬中心cij、偏離程度bij和連接權重wj分別進行初始賦值,采用梯度下降法對參數進行修正。經過多次實驗發現:學習率lr=-0.2,迭代步數s=1200時,得到的模型是最優的,此時模型的全局誤差E=3.6259。整個訓練過程中,模型的全局誤差變化曲線如圖1所示。

圖1 預警模型的全局誤差變化曲線圖
利用建好的成績預警模型對訓練樣本和測試樣本分別進行期末成績預測,得到自檢正確率為74.07%(圖2),測試樣本期末成績預測正確率為75%(圖3),模型的整體逼近性較好。

圖2 預警模型訓練樣本的網絡輸出

圖3 預警模型測試樣本的網絡輸出
本文以某高職院校數學專業一年級學生第一學期的數分成績作為分析數據,選取數分學習興趣、學習行為、學習認知、自我效能感和作業習慣5個因素,建立期末成績預警模型。通過學生的學習習慣及數分行為表現等,預測學生的期末成績,預先給學生危險的警示,幫助學生構建有效的個性化學習模式及學習幫扶機制,提升學生考試通過率,從而提高教育教學質量。