李成友,李德奎,馮興無
(1.聊城大學 計算機學院,山東 聊城 252000;2.聊城市教育和體育局,山東 聊城 252000)
隨著新的教學技術的不斷涌現,出現了很多新的教學形式,但是課堂教學依然在教學形式中占有基礎地位,對高校教學工作有重要意義。同時,線下線上融合教學已經成為課堂教學的一種新趨勢,作為教學活動的重要組成部分,教學評價受到學校以及教師的重視。教學評價有利于教師對教學思想以及教學內容的重新認知,教師能夠根據評價的結果來改變自身的教學方法以及教學內容,鼓勵教師使用新的教學理論,激發教師在課堂教學中的積極性和創新性。而且教學評價能夠使教師認識到自身在教學工作中的成效和失誤,總結經驗,有利于教師之間進行交流學習,提升自身教學能力。
因此,高校教學評價體系建設是當前教育教學改革發展的趨勢,科學的評價體系對提高教學質量、促進教學管理具有極其重要的意義。但是,傳統的教學評價大多都采用了問卷調查以及質性調查方法,帶有很強的主觀性,使得評價的主題以及主體較為單一、評價內容不能及時反應教學內容等問題[1]。因此需要建立可以隨著教學變化而變化的動態評價體系。
隨著線上教學的不斷深入發展,線上輔助教學已經成為教學環節中不可或缺的重要內容,線上教學中的所有內容以及教師和學生的所有行為都存儲在數據庫中,有必要挖掘這些數據庫中的知識,使其應用于實際教學中[2]。但是線上教學平臺在設計之初基本沿用了傳統的教學評價方法,僅僅在最后的教學結束后使用問卷調查的方法來對教學進行評價,沒有建立基于教學數據的評價體系。
本研究基于此,在收集了超星泛雅在線教學平臺的教學統計數據后,通過對數據的分析以及教學評價指標的文獻研究,得出基于在線教學統計數據的教學評價指標體系建設流程,通過數據挖掘中比較成熟的K-means聚類算法對數據進行體系化建模,建立了可實際操作的、可解釋的在線教學評價指標體系。
教學評價是教學活動的必要環節,教師能夠從教學評價中發現自身教學活動中的問題,可以判斷教學方法是否合理、教學策略是否科學,通過教學評價的結果探討現行的教學理論能否支撐起課堂教學,有助于促進教學理論的發展,完善和健全教育體系。
教學評價的實施對教學改革和教學管理等一系列教學工作都有一定的指導作用,選擇合適的評價方法對教學評價工作的實施非常重要。傳統的教學評價多采用定量與定性分析相結合的方法,如基于學生問卷的統計分析法、基于專家意見的層次分析以及模糊綜合評判法、以及在學期中對學生的訪談法等方法[3]。雖然現有的評價方法形式多樣,但是學生的問卷以及專家的意見帶有一定的主觀性,而且由于傳統的評價大都只能在學期結束后進行,這就存在評價內容不能真實體現教學內容、評價反饋不及時等缺點,得到的結果也不夠科學準確[4]。因此,需要建立一套客觀的,可以隨著課堂的進展而動態變化的真實反應教學行為的評價體系及流程。
在線學習平臺記錄了大量教師與學生的學習行為數據,其中包含教師與學生的教學和學習投入、教學與學習和認知過程等信息。這些數據反映了教師在在線教學中為了實現教學目標而進行的備課、課堂進行以及監督等行為,是教師為了實現教學所付出的努力,這與教學過程、績效等直接相關,是教師的整體教學經歷,這些數據為優化教學過程、提高學生學習體驗提供了重要依據[5]。因此可以將這些行為數據進行分析、挖掘,得出一定的對教學有用的信息。
Chen等[6]融合灰關聯理論(GRA)、模糊關聯規則、K-Means聚類算法和模糊推理四種計算智能理論,得出了一種學習績效評估系統。利用這個系統,教師能夠了解影響學生學習成績的根本原因。Talavera和Gaudioso[7]運用聚類分析挖掘學習者信息用來找到可以體現用戶行為的有效模式,并且基于協同管理方案提出了模型,可以在非結構化的合作空間中表現相似行為群體的特性。
目前,有些高校已經運用數據挖掘的方法去分析數據庫里的各種數據,期望尋找出一些影響學校發展的相關因素,認識如何評價整體教學以及學校發展之間所存在的關系。本研究使用比較成熟的K-means聚類算法對超星平臺統計數據進行聚類,得出可以解釋的在線教學評價指標體系。
超星泛雅平臺的智慧課堂系統可以將教師的PPT、作業、MOOC、視頻、文檔等資料存儲在云端,教師可以通過系統向學生發送各種信息,系統以課程為中心、教師為主導、學生為主體,充分關聯教室已有硬件,可以覆蓋多種教學模式。教師可以進行簽到、選人、搶答、分組教學、主題討論等教學活動。
超星泛雅平臺有自己的大數據分析系統,包括大數據屏、大數據移動端以及大數據PC端,但是大數據分析系統主要的目的在于對教學內容與活動的統計與分析,幫助管理者了解學校的情況,并沒有針對教學評價的模塊。
本研究所提取的超星平臺數據統計了所有的有關教學的指標,總指標數有93個,排除與課堂行為信息無關的指標后,與課堂相關指標有80個。為綜合評價教師的教學,需要對這些指標進行分解或是合并。同時教師在使用平臺時,并不是所有的指標都用到,但是也不能說這個指標以后用不到,因此需要建立一個動態的可以調整的評價指標體系模型。
K-means算法也稱之為均值算法,是聚類分析中比較成熟的方法,其中心思想是在歐幾里得空間中劃分個數據對象,通過初始中心策略實現對象選擇,使其成為聚類中心。再對其他對象計算和每個質心距離,使用最近的歸類,再次對每個簇數據平均值進行計算,能夠得到全新聚類中心,對此過程反復進行迭代計算,直到全部聚類收斂,具體算法流程如表1所示。

表1 K-means算法流程
一般來說,聚類數的確定是K-means算法的重要部分,很多研究根據行業的經驗來確定聚類數,但是這種方法帶有主觀性,結果不一定是數據的真實聚類數,因此研究領域會使用數據自身來確定真實的聚類數。通過數據自身來確定聚類數的方法有2種,一種是誤差平方和(SSE)方法,另一種是輪廓系數法。
SSE方法的原理是,隨著聚類數的增大,每個簇的聚合程度會逐漸提高,誤差平方和SSE自然會逐漸變小。由于k的增大會增加已經發現的簇的聚合程度,當k小于可能的真實聚類數時,SSE的下降幅度會相應變大,而當到達理論可以到達的聚類數時,再增加k的化,所得到的聚合程度的回報會相應變小,進而的下降幅度會發生很大的下降變化,然后隨著值的繼續增大而趨于平緩,SSE公式如式(1)。
(1)
式(1)中,ρ是Ci中的樣本點,ci是第i個簇,mi是的Ci中所有樣本的均值。
該方法是以確定樣本的輪廓系數S為目標,某個樣本點Xi的輪廓系數S定義如式(2):
(2)
式(2)中,α是Xi與相同簇的其他樣本的平均距離,稱為凝聚度,b是Xi與最近簇中所有樣本的平均距離,稱為分離度。
求出所有樣本的輪廓系數后再求平均值就得到了平均輪廓系數。平均輪廓系數的取值范圍為[-1,1],且簇內樣本的距離越近,簇間樣本距離越遠,平均輪廓系數越大,聚類效果越好。這樣平均輪廓系數最大的便是最佳聚類數。本研究同時使用2種聚類數的標準,并選取其中較為合適的為聚類標準。
由于一次聚類的結果不一定可以被解釋,因此本研究使用了循環分析的流程,首先確定聚類數后進行K-means聚類分析,得出結果后再與現實情況相比較,如果得出的簇過小或是不能被解釋,將其刪除后重新進行聚類分析,直到得出可以接受的解釋結果的最終指標后停止分析。具體流程如圖1所示。

圖1 數據分析流程
首先對超星平臺統計數據進行預處理后,確定聚類數。由于教師使用超星平臺的方法不一,平臺的很多功能部分教師沒有使用,因此為保證聚類的結果,本研究比較了和輪廓系數法對聚類數的不同結果。第一次全部數據的聚類數分析結果如圖2和圖3所示。結果顯示,方法僅僅將聚類數分成了2類,而輪廓系數法分類的結果為11個類別,輪廓系數更能體現數據之間的關系。因此第一次的數據聚類K值的確定使用11。

圖2 SSE方法簇的個數結果

圖3 輪廓系數法的簇的個數結果
圖4為第一次K-means的結果,結果顯示第一次聚類結果僅僅將一些奇異值區分開來,沒有真正意義上將結果聚類,因此將奇異值放入未解釋結果中,將剩余變量繼續進行聚類分析。

圖4 第一次聚類結果
經過3次聚類分析后,80個指標被縮減成了31個,共提取了5個維度作為最終在線教學指標體系,結果如表2所示。

表2 聚類分析最終結果
課堂教學離不開教和學兩部分,一部分是教師對課堂以及課程的建設,另一部分是課堂中的與學生的互動以及對學生的監督,本研究的結果驗證了這一點。通過3輪K-means聚類分析,將80個指標減少到31個,并且聚類成5個可解釋的維度。其中課堂整體建設為教師在線對課堂的整體規劃設計與建設,可以用設置了多少章節、上傳了多少資源(特別是視頻資源)、章節的資源數是否合理、發放了多少通知來具體測量。課程的整體建設可以解釋為對課程的章節內容、PPT文檔數以及作業的數量。教師的主動性可以解釋為教師在在線教學中控制授課的能力,主要表現在主動發帖、章節測驗、考試次數、問卷回收率、課堂互動的活動數以及提供其他課堂資料的數量上。教師在線互動是教師與學生的互動情況,主要解釋為討論、回帖、搶答數量等。最后是學生的互動,可以解釋為學生參與在線授課的主動性,可以用課程互動活動數、總討論數、總回帖數、學生討論數、學生回帖數來測量。
隨著線上線下教學的不斷融合,傳統的線下教學的評價指標體系已經不能適應新的變化,因此需要建立一套線上教學的評價指標體系,但是由于線上教學的功能很多,教師根據自己的愛好使用這些功能,使得后臺的數據非常分散,為了有效地反映教師的在線教學情況,需要一個動態的、可以根據教師使用而不斷更新的指標體系模型。
本研究使用了數據挖掘中常用的聚類分析方法K-means方法,對超星平臺后臺的統計數據進行了分析,提出了評價體系建立的流程。并通過實際的數據對流程進行了驗證,得出了可以解釋的在線教學評價指標體系。
但是本研究的數據僅僅是聊城大學計算機學院教師數據,由于數據量較小,得出的評價指標體系僅僅可以作為計算機學院的評價參考,在普及性上有一定的問題。同時在算法上,使用了傳統的聚類算法,在精度上可能存在一定的問題,未來期望將機器學習算法、深度學習算法等結合進來深入研究。