王堅 張媛媛 柴艷妹



摘 ?要 對學生的網絡行為進行研究,首先獲取具有典型意義的觀測指標構成原始數據集,通過因子分析,提取出能夠客觀反映學習特征的兩個公共因子,并依據不同學生的因子得分進行聚類分析,通過分析結果可以看出,學生網絡學習具有群體性的特征。此外,重點討論未來的改進重點和實施依據。
關鍵詞 學習分析;因子分析;聚類分析;網絡學習行為
中圖分類號:G645 ? ?文獻標識碼:B
文章編號:1671-489X(2019)18-0003-03
Analysis of Students Online Learning Behavior based on Factor Analysis and Cluster Analysis//WANG Jian, ZHANG Yuanyuan, CHAI Yanmei
Abstract In this paper, the network behavior of students is studied. Firstly, the original data set is made up of typical observation indi-
cators. Through factor analysis, the common factors that can objec-
tively reflect the characteristics of learning are extracted. According to the factor scores of different students, clustering analysis is
carried out. Through the analysis results, it can be seen that students
network learning has the characteristics of group. This paper also
focuses on discussing the future improvement emphasis and imple-mentation basis.
Key words learning analysis; factor analysis; cluster analysis; on-line learning behavior
1 引言
通過網絡平臺進行學習,具有學習資源豐富、學生主體性強、交互獨特及學習時空靈活的特點[1]。與傳統教學模式面對面的交流不同,學生的學習行為更多是源于自發,學習過程由學生自主確定學習步調。學生由于個性特征、學習背景、對待課程態度、網絡學習認知以及與其他學生互動程度的不同,其學習行為表現也有較大的差異性。在不同情境下,同一學生個體受到個人興趣、狀態等多方面特征的影響,獲得感也有所不同,有時甚至會產生惰性心理,這些都對自身的適應能力和自控能力提出較高的要求,也對教學的組織和引導有著更大的期待。
學習分析是近年來教育技術領域迅速崛起的熱點問題,它的出現也推動了教育信息化的浪潮[2]。它從網絡入手學習的過程數據,特別是學生的行為數據,采用先進的分析方法和分析工具,如數據挖掘和可視化方法等,對學生在學習過程中遇到的問題進行診斷,并對學習結果做出預測,從而有針對性地優化和增強教學效果[3-4]。
學生的網絡學習行為所產生的行為數據間往往具有很強的相關性,運用因子分析方法,可以從多維的特征數據中抽取出因子組合,這些因子不能直接從原始數據中獲取,但可以通過轉換矩陣等工具計算得到[5]。本文采用因子分析的方法來客觀反映學生學習行為特征和本質,并利用因子分析的結果對學生行為進行聚類分析[6-7],對學生樣本按照其行為的近似程度,實施無監督的分類過程,對聚類結果進行判別,可以進一步確定導致不同學習行為特征的關鍵要素,關注學生切實需求,改進教學方法。
2 研究背景
大學計算機基礎作為中央財經大學的計算機公共基礎課,在培養學生計算思維、提升學生數字素養方面有著重要的作用。在課程教學實踐過程中引入混合式教學的理念,即學生的主要學習行為依靠網絡教學平臺來完成,包括視頻學習、在線練習、在線測試、在線討論等多個環節,同時輔以線下的難點授課、課程答疑、小組討論、作業評價等項內容,如圖1所示。
從圖1中可以看出,網絡平臺中一系列的教學內容、教學環節和教學元素,精心組織和建設后,以包括音視頻在內的多種媒介形式展示給學生,供其自主學習。本研究選取2017年參與該混合式教學的219名學生作為研究對象,課程開設周期為15周,以每位學生初次登錄到最后登錄平臺期間所產生的記錄數據為主要分析對象,共設計八個觀察指標,能夠從整體反映學生學習的個性化特征,通過網絡后臺獲取相關日志文件,構成初步數據集,如表1所示。
在網絡平臺學習過程中,對于視頻課件的學習是學生自主掌握有關知識點的重要環節,因此,研究中用學生觀看視頻的學習時長和學生在線學習時長共同來反映每位學生利用網絡教學資源進行學習的時間長度;登錄平臺頻次、觀看視頻頻次以每周為單位,統計學生利用教學資源的次數,用來反映時間頻度;在交流與協作類指標中,主要包括學生參與答疑次數(線上/線下)、參與論壇討論交互次數等;而階段性檢測指標主要考量學生的階段性學習成果,包括練習完成比、測試完成比等。
3 學習行為因子分析
因子分析(Factor Analysis)也稱降維分析,其基本思想是根據變量之間的相關強度對變量進行分組組合,組內變量相關性較強,組間變量相關性較弱。每一組變量代表一個不可直接觀測的潛在變量,即公共因子。公共因子可以看作所有指標的共同影響因素,通過因子分析,每一個變量都可以表示成公共因子的線性函數與特殊因子之和,即Xi=ai1F1+ai2F2+…+aimFm+εi(i=1,2,…,n)。其中F1,F2,…,Fm為公共因子,εi為指標Xi所對應的特殊因子,表示原始變量中所特有的部分。在原變量X和因子F可以通過轉換矩陣A建立關聯,表示為:X=AF+ε。其中:
為了能夠對學生學習行為進行綜合分析,采用因子分析對有關指標特征進行降維,即學生的學習行為可以通過少數幾個公共因子來進行解釋。表2給出KMO檢驗統計量與Bartletts球形檢驗結果。KMO統計量等于0.894,Bartletts球形檢驗的值為0.000,這些也都說明本例中的數據比較適合進行因子分析。
表3中給出因子分析各個階段的總方差解釋表,根據特征值大于1的主成分提取原則,可以提取出兩個公共因子。從表3中可以看出,前兩個因子已經可以解釋原始變量73.341%的方差,已經包含大部分的信息,即所有學生行為指標可以用這兩個公共因子進行表征。公因子經過旋轉后的方差貢獻有所變化,但總的累積方差貢獻率并沒有改變,依然是73.341%,而因子間的差異性有所減小。
表4給出旋轉后的因子載荷矩陣,從表中可以看出,第一個公共因子在指標X1、X2、X4、X3、X5、X6上有較大載荷,說明這六個指標有較強的相關性,可以歸為一類。從指標類型來看,這六個指標屬于在線學習參與程度,因此可以把第一個因子命名為學習參與因子。第二個公共因子在指標X8、X7上有較大載荷,同樣可以歸為一類。這兩個指標同屬學習檢測指標,因此可以把第二個因子命名為課程測試因子。
4 學習行為聚類分析
聚類分析(Cluster Analysis)是研究指標分類問題的一種多元統計方法,不同學生的學習行為具有相似性,通過歸類研究,有助于了解和分析不同分類群體的特征。
K-Means聚類算法是目前常用的一種聚類算法,需要首先確定類別數和對應的初始聚類中心,按最小距離原則將各特征值分配到某一類別中,之后不斷地計算各個類別中心和調整各特征的類別,以各特征到類別中心的距離平方之和最小作為最終收斂判定依據[7]。
本文采用K-Means算法進行聚類分析,利用進行因子分析過程中產生的所有學生的公共因子作為輸入特征,產生聚類結果如表6和表7所示,所有學生被分成三類。
第一類學生普遍具有在線時間長、學習內容具有連貫性的特征,其在線學習參與度高,具有自我約束機制,通過測試、練習積極提升自己的知識掌握能力。還可以判斷出,這部分學生具有相當的主動性,樂于交流和相互學習。同時,這類學生在所有學生樣本中占比最高,表明網絡平臺課程環節的設置能夠與大多數的學生需求相匹配。
第二類學生網絡學習的參與度和自主性最差,對課程學習參與程度不能達到課程基本要求,同時對練習、測試環節的關注程度也比較低,不能適應網絡學習中自我約束、自我激勵的要求,在學習主動性上亟待提高,必要時可以通過積極有效的手段進行干預。
第三類學生通過練習、測試等環節進行學習的積極性較高,而對在線課程的學習投入方面相對不足。這部分學生喜歡有激勵的學習環節,更愿通過做題的方式來快速提升自己;對在線學習的其他環節重視度不高。對于這部分學生,著重需要通過增強網絡教學的吸引力,以更加靈活多樣的方式來鼓勵他們重視學習過程。
從聚類整體結果可以看出,當學生處于第一類別時,能夠很好地利用現有網絡平臺的教學資源,其學習效果整體較好,可以考慮引入適當的激勵措施,保持其對網絡平臺參與的熱情和自我把控;當學生處于第二類和第三類時,應及時給予相應的輔助手段,如增強定向輔導或實時溝通,促進學習態度和學習行為的有效轉換;特別是對處于第二類別學生,要及時發出學業預警,進行關注。
5 研究結論
本文應用統計方法,通過對不同類型學生群體的行為特征進行分析,可以看出,學生大多能夠適應和參與網絡學習過程的構建,但仍然有部分學生興趣不足,需要給予他們更好的沉浸式體驗、更多的學習獲得感,在平臺的建設和設置過程中也需要增強靈活性和自適應能力。未來的工作重點將是以學生興趣為著眼點,改善學習環境,幫助學生獲得感的增強。
同時,本文所使用的學習行為特征,還是以學生的學習過程為主,但學生的學習習慣的養成和學習成績的獲得往往還受到學生的個性化因素的影響,如學生的學習態度、接受能力、情緒因素等,將這些因素結合起來,有助于更好地對學生群體進行分析。此外,本文中采取的聚類方式是事先確定了學生類別的,但實際中學生群體的劃分是動態變化的,捕捉這種動態,有助于對實際學習過程的評判。而且單個學生群體的構成和演化有著一定的內在規律,個體的學習行為和群體的學習表征存在某種聯系,對每一個群體,需要分析哪一個學生或者哪一些學生構成了核心,每一個人的學習行為是如何影響整個群體的學習過程的。
從增強學習效果的角度,因子分析和聚類分析等方法僅僅是提供了入口,除了及時了解和分析學生行為特征外,還要根據其學習記錄,如觀看視頻情況、作業情況和測試情況,針對不同群體學生的學習規律做好資源服務和內容推送,滿足其階段性需求,同時對未來的學習路徑和學習效果進行預測,實現智能追蹤,創建自適應的學習系統。
參考文獻
[1]邱曉輝.網絡學習者信息加工學習行為的分析及研究[D].武漢:華中師范大學,2008.
[2]劉清堂,王洋,雷詩捷,等.教育大數據視角下的學習分析應用研究與思考[J].遠程教育雜志,2017,35(3):71-77.
[3]郭炯,鄭曉俊.基于大數據的學習分析研究綜述[J].中國電化教育,2017(1):121-130.
[4]EDUCAUSE, The New Media Consortium. Learning Analytics[R].The Horizon Report 2011 edition.
[5]賈麗艷,杜強.SPSS統計分析標準教程[M].北京:人民郵電出版社,2010:299.
[6]常浩,逯紀美.多元統計分析在大學生綜合素質評價中的應用[J].數理統計與管理,2010,29(4):754-760.
[7]孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學報,
2008,19(1):48-61.