





關鍵詞:大數據;課堂交互評價;層次分析;聚類分析;智慧教室
中圖分類號:G642 文獻標識碼:A
文章編號:1009-3044(2025)03-0067-03 開放科學(資源服務) 標識碼(OSID) :
0 引言
近年來,大數據和人工智能技術在教育領域的應用日益廣泛。新工科人才培養強調學生的創新意識和實踐能力,課堂交互作為實現這一目標的重要途徑,成為教學改革的重點。課堂教學交互效果評價是檢驗教學質量和推進教學改革的重要環節,其科學性和準確性至關重要。然而,傳統的課堂教學效果評價方法存在以下問題:
主觀性強:傳統評價方法主要依賴教師的經驗和學生的感受,評價結果易受主觀因素影響,缺乏客觀性和可比性。
評價指標單一:傳統評價方式通常只關注師生互動頻率、學生參與情況等少數評價指標,忽略了學生學習效果、知識水平、情感態度等多方面因素。
評價方法局限:傳統評價方法主要依賴教師自我感知、學生問卷調查等方式,無法全面、實時地反映課堂交互的真實情況。
評價結果反饋滯后:傳統評價通常在課程結束后才進行,無法及時發現和解決教學中存在的問題,不利于教師及時調整教學策略。
傳統評價方法的局限性,促使研究人員尋求更加科學、客觀的評價方法,以滿足新時代教育評價的需求。
1 基于大數據的課堂交互效果評價相關研究
近年來,許多研究者開始探索利用大數據和人工智能技術進行課堂交互效果的評價。文楷等提出了基于視頻分析的課堂教學效果自動評價系統,采用了考勤檢測、學習狀態分析等模塊,實現了課堂教學效果的自動評價[1]。宋陽春等研究了高校學生評教現狀,并提出了相應的對策建議[2],徐俊武等定量分析了翻轉課堂教學模式對學生成績的影響,發現翻轉課堂模式對學生期末考試成績有顯著的正向影響[3]。金力等學者利用深度學習技術構建了課堂教學效果評價模型,能夠獲取學生面部表情變化,促進課堂教學質量的提高[4]。任遠芳以智慧課堂為研究案例,提出了大數據背景下智慧課堂教學效果評價的構建策略[5]。這些研究豐富了課堂教學效果評價的方法,采用了機器學習、深度學習等先進技術,以提高評價的準確性和效率,為教學質量提升提供了新的思路和方法。但是也都存在交互效果評價不突出,評價指標泛化能力差,通用性差,不符合學校統一管理需求等問題,本文提出一種基于大數據的高效課堂評價方法,能較好地適應不同課堂類型,能獲得師生認可的評價結果。
2 大數據驅動的教學交互評價模型
課堂交互效果評價模型包括評價指標、指標權重和指標量化等諸多元素。目前層次分析、主成分分析等統計分析模型已經廣泛應用于教學效果評價,在信度和效度性能上表現良好。本研究采用層次分析法(AHP) 構建教學交互評價模型。主要通過將教學交互問題分解成多個層次和因素、確定判斷矩陣、計算相關權重、完成一致性檢驗,最終得出評價結果。
2.1 評價標準的層次結構
根據新工科人才培養目標,分析課堂教學交互的各要素關系,融合課堂的交互主體、目標任務等多個視角分析確定評價標準的層次為:學生、教師和目標達成度。如圖1所示。
學生層包含:參與度、專注度、參與質量三組測量項。
教師層包含:反饋及時性、目標達成度等二組測量項。
教師學生復合層包含:互動頻率一組測量項。
學生和目標達成度復合層包含:參與質量一組測量項。
詳細的觀測點如表1所示。
2.2 數據采集及量化
表1中具體觀測點數據,可利用智慧教室中相關支撐技術完成采集。如課堂互動次數、回答問題頻率等數據可用AI行為識別系統自動檢測和記錄學生在課堂中的主動互動行為,包括舉手、發言和提問次數等。教師提問次數等數據可以通過教室內的麥克風陣列和語音識別技術進行采集記錄。
評價中采集的數據都是課堂參與者實際產生的,不同課程和教學場景產生的數據規模不同,因此不能使用統一的標準來量化等級。為達到數據量化的自適應性,利用縱向聚類算法將每個觀測點采集的數據量化為具體的等級,本研究中采用K-means聚類分析法[6],具體步驟:
1) 數據標準化:對各數據進行z-score[7] 標準化,如式1所示。
z 為標準化后的數值,x 為原始數據值,μ為數據的均值,σ為數據的標準差。通過z-score標準化,可以消除不同指標的量綱差異,使其在同一尺度上進行比較。
2.3 指標權重計算方法
為體現指標體系的科學性,評價指標的權重應適配不同的教學場景或課程類型。本研究提出的評價體系,可根據具體情況分析計算各指標的權重,從而使評價體系更加貼合實際教學情況,使評價結果更具客觀性。評價指標所占權重采用熵值[8]法確定。通過計算各指標的信息熵,衡量其信息效用,熵值越小,指標的信息效用越大。根據信息效用值確定權重,效用值越大,權重越高,以此客觀地反映各指標在整體評價中的重要性。研究中采用的步驟如下。
1) 數據標準化:消除指標之間量綱的影響,對各項數據進行標準化處理;
2) 計算熵值:根據標準化后的數據,依次計算每一項指標的熵值;
3)確定信息效用值:根據熵值計算各指標的信息效用值;
4)計算權重:根據各項指標信息效用值計算各項指標的權重。
3教學交互效果的案例研究
3.1對象樣本
研究樣本來源于某地方高校的新工科課堂,利用智慧教室中的AI行為識別、面部追蹤、在線課堂問卷等多種手段,采集學生課堂參與和互動情況的數據。
本次評價樣本涵蓋4門新工科課程,共計120名學生和4位授課教師,評估一個學期內110節課的課堂教學情況。具體評價數據包括學生出席情況、課堂互動次數、回答問題頻率等維度17項,共計890萬條數據。
3.2分析方法
基于先前討論的大數據驅動的教學交互評價模型,采集數據后,進行聚類分析和量化處理,然后對數據進行標準化處理。采用熵值法確定各指標的權重。最后,使用加權求和方法計算每次課堂的交互效果。整個過程確保了數據處理的科學性。回收的數據在Pytorch2.3工具中進行統計分析,以驗證評價體系的可靠性和有效性。
3.3信度分析
信度分析用于評估評價指標體系的可靠性,即各指標之間的一致性和穩定性。常用的信度分析方法是計算Cronbach's Alpha系數[9],當α值大于0.7時,表明評價指標體系具有較好的內部一致性。本研究提出的課堂交互效果評價指標體系,也采用計算Cron?bach's Alpha系數,來驗證模型的內部一致性和信度。分析結果如表3所示。
從表3數據中可以看出,四門科目中各指標的α(Cronbach's Alpha) 均在0.895以上,最高為0.915,表明各測試評價的α值均大于0.7,滿足量表的信度系數要求。綜合分析顯示,四次測試中α值都較高,說明評價指標之間內在信度較好,評價體系具有較高的可靠性。
3.4 效度檢驗
效度檢驗用于評估評價結果的準確性和可信度。本研究采用因子分析法[10]對課堂交互效果指標體系的效度進行檢驗,以確保各評價項能夠真實反映課堂交互效果。通過探索性因子分析(EFA) 識別各項指標的潛在結構。進行確認性因子分析(CFA) ,檢驗各指標的加載系數,確保模型擬合度良好。最后,采用Kaiser-Meyer-Olkin (KMO) 檢驗和Bartlett 球形度檢驗,驗證數據的適用性。分析結果如表4所示。
從表4數據中可以看出,四門課程的KMO值均大于0.8,表明數據適合進行因子分析。Bartlett球形度檢驗的χ2值顯著(Plt;0.001) ,說明數據具有良好的因子結構。因子負荷范圍在0.68至0.92之間,表明各評價項對相應因子的解釋力較強。綜合分析顯示,本研究的評價指標體系具有較高的效度,能夠準確反映課堂交互效果。
3.5評價效果對比分析
為了驗證本研究制定的評價指標體系的合理性,研究中選取了6名教學專家對A課程的三節課進行評價。專家評分標準采用優良中差5級打分制,評分范圍為60至100分。最后將專家評價結果與所提出評價體系結果進行對比分析,以檢驗評價體系的可靠性和有效性,結果如圖2所示。
圖2中可以看出,專家評分與本研究所提評價體系評分在不同課程節次上的誤差在±5%左右,誤差范圍較小。分析結果表明所提評價指標體系與專家評價結果具有較高的一致性,能夠較為準確地反映課程的實際教學效果。因此,本研究制定的評價指標體系具有較高的可靠性和有效性,可以用于課堂交互效果的評價。
4結束語
本研究圍繞課堂交互效果評價“現狀”“優勢”“如何”三個問題展開:針對“現狀”問題,本研究詳細分析了基于大數據的課堂交互效果評價體系的構成與特征,闡述了其在新工科教育中的重要性和應用前景;針對“優勢”問題,探討了傳統課堂交互效果評價方法存在的局限性以及現代大數據技術在提升評價客觀性和準確性方面的優勢;針對“如何”問題,本文構建了基于層次分析法的教學交互評價模型,提出了科學的數據采集和量化方法,并通過信度和效度檢驗驗證了評價體系的可靠性和有效性。
本研究旨在通過大數據技術和人工智能手段,構建一個科學、全面、實時的課堂交互效果評價體系,提升教學效果的反饋速度和準確性,為教學策略的及時調整和優化提供依據。研究發現,該評價體系在多個新工科課程的實際應用中,能夠有效地反映課堂交互效果,且與專家人工評價結果具有高度一致性,證明了其在實際教學中的可行性和可靠性。
未來將進一步優化評價指標和數據采集方法,探索更多維度的交互效果評價,如增加情感分析、認知負荷等,以提升評價的科學性。同時,如何將評價結果更好地應用于教學改進,形成閉環的教學質量提升體系,也是后期值得深入探討的問題。