尹 桐,杜樹杰
(中國海洋大學基礎教學中心,山東青島 266000)
基于BP神經網絡的大學生深度學習水平預測模型構建
尹 桐,杜樹杰
(中國海洋大學基礎教學中心,山東青島 266000)
由于BP神經網絡強大的自組織和自適應能力,本文基于BP神經網絡構建了大學生深度學習水平預測模型,使用NSSE-China2013問卷作為數據的來源,將院校間的五大可比指標作為網絡的輸入、大學生深度學習水平作為網絡的輸出,并在Matlab中仿真實現。實驗結果表明,該預測模型克服了傳統評價深度學習水平的復雜性和主觀性,具有收斂速度快和預測精度高等特點,具有很好的適用性。
BP神經網絡;大學生深度學習水平;NSSE-China;預測模型
隨著國家逐漸步入學習型社會,國家和社會對于知識和人才的需求和重視程度逐漸加大,而大學生作為接受高等教育的精英群體,其學習情況直接影響著學習型社會的深度和廣度,因此研究大學生的學習情況越來越具有現實意義。而評價學生的學習情況,不僅要衡量知識的廣度和數量,還要考察學生是否善于將新思想與原有的知識結構相聯系,并最終獲得解決問題的能力,即深度學習能力。全球信息化的快速發展極大地改變了當代大學生的學習模式,大量的學生長期處于淺層學習當中,這會大大限制學校對學生解決問題能力和創新能力的培養。本文通過分析與預測大學生深度學習水平,可以幫助學生及時調整自身學習狀態,幫助教師更加有針對性地改進教學策略,同時也可以為院校的教育改革提供科學的指導。
BP神經網絡是一種人工智能算法,具有很強大的非線性映射能力、自組織和自適應能力。因此本文以中國海洋大學“大學生學習性投入調查”問卷(NSSE-China)所統計的數據作為依據,構建了評價大學生深度學習水平的數學模型,從而為大學生深度學習水平的研究提供一定的參考價值。
深度學習和淺層學習這兩個概念是由國外學者FerenceMarton和Roger Saljo在1976年聯名發表的 《學習的本質區別:結果和過程》一文中首次提出的。[1]他們通過一項實驗,總結出學生學習的兩種不同學習策略,即淺層學習策略和深層學習策略。他們認為所謂淺層學習,就是指不加以思考地記住書本中提到的一些原理或事實,所關注的是在測驗中遇到的書本中提及的那些內容;而深層學習,是指理解整本書中的思想,試圖領會其學術內涵,關注的焦點是如何將書本中的知識應用在現實生活中。
經過長期對深度學習的深入研究,國內學者何玲和黎加厚在《促進學生深度學習》一文中對深度學習做出了較為精準的定義。所謂深度學習,是指在理解學習的基礎上,學習者能夠批判性地學習新的思想和事實,并將它們融入原有的認知結構中,能夠在眾多思想間進行聯系,并能夠將已有的知識遷移到新的情境中,做出決策和解決問題的學習。[2]
根據上述對深度學習的定義,可以將深度學習按照布魯姆的教育目標分類學來對其進行概括和總結。布魯姆等人在認知學習領域將教育目標分為六大類,從低級到高級依次為識記、理解、應用、分析、綜合和評價。淺層學習的認知水平停留在第一、第二層,而深層學習的認知水平對應著后面的四層。[3]因此,本文認為深度學習是指批判性地接受新知識,通過整合原有知識,構建出屬于自己的知識體系,并獲得解決問題的能力。
本文的重點研究對象是大學生群體,相較于中學生群體而言,大學生群體擁有更多的自主學習時間和更為豐富的課余活動,獲得教學資源的內容和途徑也更加廣泛和便捷,因此大學生的學習模式更多的是自主學習模式,這也是其與中學生的重要差別之一,大學生真正成為了學習活動的主體。同時,由于大學生即將離開校園步入社會,這一角色特殊性決定了大學教育應該更加注重培養學生創新和解決問題的能力,即深度學習能力。然而目前的研究發現,大量的大學生長期處于淺層學習狀態,長此以往將不利于社會的進步,因此大學生深度學習能力的培養具有更大的研究價值。
本文所采用的數據來源于2013年中國海洋大學“全美大學生學習型投入調查”漢化版(NSSE-China)問卷,通過篩選題目構成深度學習量表,來考查大學生深度學習水平的相關影響因素并構建預測模型。NSSEChina問卷的原型是印第安納大學開發的 “全美大學生學習性投入調查”(National Survey of Student Engagement,以下簡稱NSSE)問卷。NSSE是一個針對美國全國范圍內四年制本科院校學生投入高層次學習活動和發展程度的年度調查。[5]NSSE-China項目于2007年啟動,經過一系列文化適應和預測試后于2009年首次在中國全國范圍施測。[6]該問卷具體測量了幾項指標,包括院校間的五大可比指標(具體包括學業挑戰度LAC、主動合作學習水平ACL、生師互動SFI、教育經驗的豐富程度EEE和校園環境的支持度SCE)、院校診斷九項指標、深度學習(DL)指標以及社會稱許性指標。經清華大學的幾次修訂,目前的量表具有良好的信度與效度。[7]
本文利用NSSE-China問卷采集的數據來構建大學生深度學習水平預測模型。經過研究發現人工神經網絡是構建預測模型非常有效的方法。其中BP神經網絡是人工神經網絡中應用最廣泛的一種,其具有強大的非線性映射能力和自組織、自適應能力,因此本文選擇利用BP神經網絡來構建大學生深度學習水平預測模型。
將回收的有效問卷通過SPSS軟件計算出每個學生的五大可比指標成績與深度學習指標成績。經分析數據得出,學生的深度學習指標成績分布區間為9.09~100,本文將深度學習水平分為優秀、良好和不合格三個等級。分級標準如表1所示:

表1

BP神經網絡是一種多層前饋神經網絡。最基本的BP神經網絡由輸入層、隱含層和輸出層組成,每層有許多互相不連接的神經元節點,相鄰兩層節點通過連接權連接,其拓撲結構如圖1所示。

圖1 BP神經網絡結構
(1)輸入層節點的確定
由于問卷當中涉及的院校間可比指標有5個,因此,輸入層神經元個數定為n=5。其中:X1表示學業挑戰度,學業挑戰度的考察包含了學生個體和院校組織兩個層面的含義——既要反映學生的學習行為表現及其在學業上的時間和精力的投入程度,又要通過學生的行為表現和自我報告來間接對高校的學業要求、學業標準和對學業的支持程度等進行評價,以體現高校的教育質量。[8]X2表示主動合作學習水平,評價的是學生的合作性學習能力和與多元人群討論的能力。X3表示生師互動,評價的是學生與教師互動的頻繁程度及其主動性和互動的質量。X4表示教育經驗的豐富程度,評價的是教師教學實踐的有效性,包括有組織的教學活動、清晰的知識講解、具有說明性的舉例和有效的反饋。X5表示校園環境的支持度,評價的是校園中人際溝通的質量和學校對促進學生學習和發展的支持程度。
(2)輸出層節點的確定
本文主要是來評價大學生的深度學習情況,最終目的是能夠得到一個客觀、準確地反映大學生深度學習水平的量化值。因此本文將大學生深度學習水平的量化值作為BP神經網絡的輸出向量,即輸出層神經元個數確定為m=1。
(3)隱含層個數的確定
如今尚不存在一個確定的標準來計算隱含層的神經元個數,但可以根據以下公式來計算出隱含層神經元數量的大概區間范圍,進而通過試湊的方法來確定最佳的隱含層的神經元個數。因為輸入層神經元個數為5,輸出層神經元個數為1,則在參考經驗公式l〈n-1,l〈(式中,n為輸入層節點數;l為隱含層節點數;m為輸出層節點數;a為0-10之間的常數)的基礎上,初步選取一個比較小的隱含層節點數進行訓練,如果達到了規定的訓練次數或者在有限的訓練次數內沒有收斂,則停止訓練,然后逐步增加隱含層節點數,重新訓練。綜合分析多次訓練效果,最終確定該網絡的隱含層個數為兩個,且每個隱含層的個數分別為25和20。

為取消各維數據間數量級差別,避免因為輸入輸出數據數量級差別較大而造成的網絡預測誤差較大,神經網絡一般會對數據進行歸一化處理。本文采用公式為的函數對數據進行歸一化,并將數據處理為在區間[0,1]之間的數據。

傳遞函數的選擇與輸入數據和輸出數據的取值區間有關,經過多次實驗,觀察網絡的訓練效果,最終將第一個隱含層的傳遞函數參數確定為S型正切函數,第二個隱含層的傳遞函數參數確定為S型對數函數,輸出層的傳遞函數確定為線性函數。其對應的函數數學表達式依次如下:

線性函數y=x
通過觀察多次訓練效果,發現本網絡模型的收斂速度快、訓練時間短且訓練效果良好,因此該網絡選取BP網絡標準的最速下降法作為訓練的方法即可。其他函數參數均選用BP神經網絡工具箱的默認值。
根據網絡的性能來設定網絡的訓練參數。其中將網絡的最大訓練次數設置為100次,如果超過該次數網絡仍然沒有收斂則表示網絡不收斂,訓練停止;將網絡的最大確認失敗次數設置為15次,即網絡的驗證誤差連續15次沒有下降,則表明網絡的訓練效果不好,訓練停止;將網絡的訓練目標設置為0.003,當網絡的目標誤差達到該目標值時,訓練停止。
BP神經網絡模型主要借助Matlab語言工具來實現。

根據上述構建的網絡預測模型和函數參數的設置,對網絡進行訓練,具體訓練過程如下:
(1)將訓練數據進行歸一化處理,使其分布在[0,1]之間,并將預測輸入數據按照同樣的歸一化方式進行歸一化處理。
(2)將歸一化后的數據輸入到網絡模型當中,按BP網絡的學習算法訓練網絡,其流程圖如圖2所示,最后將預測輸出進行反歸一化處理。
(3)將預測輸出和期望輸出按照分數區間劃分為三大類,即優秀、良好和不合格,并計算該網絡模型的準確率。

圖2 BP學習算法流程
(4)畫出BP網絡預測輸出圖形和神經網絡預測誤差百分比圖形

BP神經網絡的學習屬于有監督式的學習,需要一組已知目標輸出的學習樣本集。因此本文從2013年中國海洋大學NSSE-China問卷中挑選出預測模型所需的1000組數據,并隨機抽取其中的900組數據作為訓練樣本,其余100組數據作為檢驗樣本,輸入到網絡模型當中,得到如圖3所示的BP神經網絡學習訓練過程曲線。從圖中可以看出,訓練迭代次數達到5次時,網絡已經收斂并且網絡的預測精度達到了設定的目標值。訓練達到要求后,選取100組作為檢驗樣本,經上述網絡模型輸出的結果與調查問卷中所顯示的大學生深度學習水平評價等級的結果相比較具有一致性,其預測輸出與期望輸出的相對誤差較小。舉例如表2所示,由于用于測試網絡準確度的檢驗樣本較多,表2中只列舉了從檢驗樣本中隨機挑選的10組數據進行比較。

圖3 BP神經網絡學習訓練過程

表2
100組檢驗樣本的BP網絡預測輸出如圖4所示,神經網絡預測誤差百分比如圖5所示。從這兩幅圖中可以看出,在100組檢驗樣本中有88組樣本的預測輸出值與其期望輸出值相符,預測準確率高達88%,總體預測誤差嚴格控制在20%之內。因此證明本文所構建的大學生深度學習水平預測模型具有很高的預測精確度。
本文為了檢驗預測輸出對期望輸出的擬合程度,在BP網絡訓練完成后的處理過程中對預測輸出的結果進行了回歸分析,回歸直線方程式為:y=0.18x+0.13,相關系數R=0.897,通常情況下相關系數R越接近1表明網絡的擬合程度越好,所以根據回歸分析說明該模型的預測輸出有效。
由于該網絡的輸入和輸出值是隨機選取的,因此每次訓練的結果均有一定程度的差異,本文對網絡進行了10次訓練,計算出的平均準確率為85.3%??梢员砻髟摼W絡的準確度比較理想,能夠根據院校間的五大可比指標來預測大學生的深度學習水平,具有一定的應用價值。
BP神經網絡具有“相似形輸入,相似形輸出”的特征,所以該方法的預測精度和科學性不僅取決于訓練樣本的數量,更取決于訓練樣本的質量。[9]訓練樣本的數量越多,質量越高,越能精確地預測出大學生的深度學習水平。同時,BP神經網絡具有很強的自組織和自適應性,因此利用BP神經網絡算法來構建大學生深度學習水平預測模型,可以使其預測結果更加精準且富有合理性。

圖4 BP網絡預測輸出

圖5 神經網絡預測誤差百分比
本文構建的大學生深度學習水平預測模型,具有預測精度高、學習速度快等特點。通過此預測模型,既可以使大學生及時地掌握自身的學習情況,也可以使教師更加方便地評價本班學生的學習狀況并有針對性地改善自己的教學策略,同時,也可以為學校的教學改革提供科學性的指導。因此利用BP神經網絡算法構建的大學生深度學習水平預測模型,在學習分析和教育改革領域具有一定的實用價值和廣泛的使用前景。
[1]Marton F.and SljR.On Qualitative differences in learning-Outcome and Process[J].British Journal of Edu-cational Psychology 1976(46):4-11.
[2]何玲,黎加厚.促進學生深度學習[J].計算機教與學,2005(5):29-30.
[3]王玨.杜威的教育思想與深度學習[J].教育技術導刊,2005(9):6-8.
[4]唐吉洪,張秀琦,程琳.基于BP神經網絡的教師教育技術能力培訓評價[J].計算機技術與發展,2013(6):249-252.
[5]張文毅,李漢邦.NSSE對我國本科教學工作評估的啟示[J].中國高教研究,2009(10):19-22.
[6]ROSS H,CEN,Y.Reinterpreting quality through assessingstudentengagementin china[G].//SOLOMONIDES I,PETOCZ P,REID A(Eds.).Engaging with Learning in Higher Education.Faringdon,Oxfordshire:Libri,2012: 383-411.
[7]清華大學“全國大學生學習與發展追蹤研究”課題.NSSE-China 2013問卷使用手冊[Z].2013.
[8]吳凡.中美研究型大學本科生學業挑戰度的比較研究[J].中國大學教學,2012(10):92-96.
[9]喬維德.基于BP神經網絡的現代遠程教育教學質量評價模型的構建[J].中國遠程教育,2006(7):69-71.
(編輯:王天鵬)
G434
1673-8454(2015)23-0072-04