□阮進軍 慈 尚 汪祥舜
國家從2019年開始實施高職院校擴招計劃,越來越多的退役軍人、新型職業(yè)農(nóng)民、高中畢業(yè)同等學歷背景的學生進入高職院校學習,相對于高職院校傳統(tǒng)生源而言,他們的年齡跨度,教育背景、學習方式和學習能力等方面的差異性更加突出。在線教學平臺由于具有課程教學資源豐富、學習時間和學習方式靈活等特點,能較好地適應(yīng)高職院校擴招學生的學習需求,因此眾多高職院校將在線教學平臺運用到社會擴招學生的教育教學過程中。但是在線教學平臺在實際應(yīng)用中,存在著一些共性的問題,例如教師和學生缺乏互動,教師無法準確掌握學生的學習狀態(tài),不能對學生進行個性化輔導;寬松的學習環(huán)境容易導致部分學生不能規(guī)律性地完成課程學習,存在突擊學習的情況,學習效果不好。因此,對在線教學平臺中大量學生在線學習行為數(shù)據(jù)進行挖掘和分析,可以促進教師優(yōu)化在線教學資源的設(shè)置,改進在線教學方法,提升學生在線學習的效率和效果。本文將構(gòu)建基于K-Means算法的學生在線學習行為分析模型,通過分析在線教學平臺中的學生學習行為數(shù)據(jù),建立學生學習行為與學習狀態(tài)之間的關(guān)系模型,幫助教師更好地掌握學生在線學習的狀況,提高學生在線學習的效率。
K-Means聚類算法具有簡單易行、可擴展等特點,是聚類分析中較為常用的一種算法[1]。它利用迭代求解的方式,通過計算每個對象和各聚類中心距離的方法,將對象劃歸到與之距離最短的聚類中心,每次迭代結(jié)束后,聚類中心都會根據(jù)當前聚類中的所有對象被重新計算,直到所有對象中沒有被再次重新分配到不同聚類的對象(或小于指定的閾值),聚類中心無變化(或小于指定的閾值)。K-Means算法的流程[2]如表1所示。
表1K-Means算法流程

(一)社會擴招學生在線學習行為數(shù)據(jù)采集及預(yù)處理。通過某職業(yè)技術(shù)學院在線教學平臺為2019級社會擴招學生開設(shè)的教學課程,對學生的在線學習行為數(shù)據(jù)進行采集,獲得了學生學習各門線上課程時的所有訪問與操作信息以及課程的考核成績信息。學生在線學習行為的具體屬性比較多,包括學員課時學習記錄、觀看視頻記錄、作業(yè)完成情況、查詢搜索課程資料、查詢話題列表、發(fā)布話題、回答話題、筆記記錄、瀏覽課程公告等,每個具體的學習行為屬性字段結(jié)構(gòu)都比較復(fù)雜,例如學生的課時學習記錄的數(shù)據(jù)表結(jié)構(gòu)如表2所示,因此首先要對每個學習行為數(shù)據(jù)進行第一步分析和篩選,去除不需要的字段,保留必要字段。上述學員課時學習記錄行為數(shù)據(jù)可以只留下userId、courseId和learnTime,即學員ID、課程ID和學習時間。最后為了確保數(shù)據(jù)的完整性、一致性,再使用自然語言處理技術(shù)來對原始數(shù)據(jù)進行預(yù)處理,
將經(jīng)過文本預(yù)處理后的數(shù)據(jù),以結(jié)構(gòu)化的形式存儲在數(shù)據(jù)庫中,便于后續(xù)的分析和處理[3]。

表2 學員課時學習記錄字段
(二)社會擴招學生在線學習行為分析。基于K-Means的社會擴招學生在線學習行為分析過程分為分析聚類階段和行為類別判斷階段,分析過程如圖1所示。

圖1 基于K-Means的社會擴招學生在線學習行為分析過程
1.分析聚類階段。本次研究抽取了某職業(yè)技術(shù)學院2019級887名社會擴招學生1個完整學期的在線教學平臺《計算機應(yīng)用基礎(chǔ)》課程學習行為數(shù)據(jù),首先經(jīng)過初步預(yù)處理后存儲在數(shù)據(jù)庫中,利用數(shù)據(jù)挖掘技術(shù)與學生的成績關(guān)系進行相關(guān)性分析,從而發(fā)現(xiàn)并選取與成績正相關(guān)較大的屬性特征。經(jīng)過分析,我們保留了課時學習記錄、觀看視頻記錄、作業(yè)完成情況、發(fā)布話題、回答話題、查詢話題列表6個特征屬性,作為社會擴招學生在線學習行為特征的研究屬性,形成了待評價的學生學習行為特征數(shù)據(jù)集,然后再選取不同的K值,利用K-Means聚類算法對學生的學習行為特征數(shù)據(jù)進行多次聚類分析,本例中當K=4時聚類效果較好,最終將2019級在線學習《計算機應(yīng)用基礎(chǔ)》這門課程的社會擴招學生劃分為4種類型的學習群體,我們分別用ABCD進行表示。具體情況如下:
A類學生人數(shù)最多(517人),占總體學員總數(shù)的58.29%,這部分學生基本都能完成課程學時學習,作業(yè)完成度較高,但是互動環(huán)節(jié)比較欠缺,尤其是主動發(fā)布話題和回答話題的積極性不高,學習成績大部分處于中等水平,我們把他們標注為被動學習型。
B類學生有115人,占比僅次于A類學生,標注為主動學習型。這個類型的學生不僅能完成課程學習和作業(yè),同時會經(jīng)常瀏覽和查詢論壇中的各類話題,但是主動發(fā)布話題的積極性不高,學習成績大部分處于中等偏上水平。
C類學生標注為學習落后型,他們的特點是能勉強完成基本的課程學時學習,觀看視頻記錄較差,作業(yè)完成度較低,幾乎不參與任何互動環(huán)節(jié),學習成績基本上都比較差。
D類學生人數(shù)最少,我們標注為學習積極型,這一類學生大部分能做到反復(fù)觀看教學視頻,高質(zhì)量完成作業(yè),積極參與話題的互動,尤其是能主動發(fā)布話題,積極回答其他同學提出的各類問題,他們的學習成績大都能達到優(yōu)秀等級。
2.行為類別判斷階段。首先提取需要判斷的某個學生《計算機應(yīng)用基礎(chǔ)》課程近一個學習周期的學習行為數(shù)據(jù),經(jīng)過初步預(yù)處理后選取和上一步分析聚類階段相同6個特征屬性,再計算該學生的學習行為特征數(shù)據(jù)與上一步得到的4個聚類中心的距離,將與之最近的聚類類型定義為該學生當前的學習行為類型。根據(jù)這個學習行為類別的判斷結(jié)果,教師可以掌握學生的在線學習狀況,對于B和D類型的學生,他們的學習習慣和學習狀態(tài)只需要繼續(xù)保持即可,對于A類學生教師要加強與他們的互動,提升他們主動學習的積極性,對于C類學生,教師則需要經(jīng)常提醒他們增加在線學習時間、提升學習效率,必要時要對他們進行學情預(yù)警,防止這部分學生不能按時、按要求完成課程學習。
為了幫助教師更好地掌握高職院校社會擴招學生在線學習行為狀態(tài),本文提出了基于K-Means的社會擴招學生在線學習行為分析模型,該模型能根據(jù)學生在線學習的歷史數(shù)據(jù),幫助教師分析和掌握學生的學習行為狀態(tài),以便及時調(diào)整課程在線教學方法,提升學生的在線學習效率。