摘要:大數據時代的到來,對數據挖掘技術的應用提出了更高要求。首屆“學習分析技術與知識國際會議”的召開,將數據挖掘方法與學習管理系統建立關聯,并從分析學習者的行為中來改善和提升物理教育效率。本文將從數據挖掘的方法、內容、方向、結果呈現等方面,就其在學習分析中的應用展開探討,并從優化數據挖掘方法上來改善學習分析技術的有效應用。
關鍵詞:數據挖掘 學習分析 關鍵技術 應用探討
基金項目:本文系河南省軟科學研究計劃項目(項目編號:142400410263,142400410267,142400410671)”的階段性研究成果。
大數據時代下信息指數型增長已經成為趨勢,對于海量數據的分析及呈現,迫切需要從數據挖掘技術的應用中來獲取有效信息?,F代教育領域中對信息化技術的應用較為廣泛,各類虛擬學習環境的構建需要符合學生的學習特性,這些數據即多又雜,更需要專門的軟件工具來進行改善和處理??梢哉f,學習分析技術是數據分析及數據挖掘技術基礎上發展而來的應用,因此,從學習分析定義及數據模型的構建上來增強對學生學習行為的研究,有助于科學的評估和預測學生的表現,改善學生的學習方式。虛擬技術中的學習環境的營造,可以通過數據挖掘技術來實現,特別是對于海量教育數據的有效提取,以幫助教育者進行分析和改進教學決策。
1 學習分析中的關鍵技術
1.1聚類技術
對于數據挖掘中的聚類,主要從抽象對象的集合分組中來進行歸類,聚類是對具有相似特性的多個類或簇進行分組的過程,并利用顯性或隱性方式進行描述。在聚類分析中,不同算法下對相關數據的分類集合也是不同的,因此需要結合數據特征來進行有效的聚類操作。在虛擬學習環境中,對于每門課程知識的建構,可以從學生的不同表現上來進行分組聚類。如對于學習積極性高的團體,可以從增強知識拓展及關聯度上來滿足學生學習要求;對于成績較低、參與度不高的學生,可以從激勵措施的組建上來增強學生的學習積極性。可見,對于聚類技術的運用,關鍵是要從學生學情的分組上,融入不同的虛擬分組策略,以激發學生能夠更好的參與學校,增進小組間學習的交流和協作。
1.2關聯規則的挖掘
從大數據環境中對相關聯數據的挖掘,主要是通過數據庫中各項集的可信度、支持度的取值來進行。對于某數據庫來說,利用形式化語言進行描述時,每一個事務都是集合,而每個集合都是M項,X、Y是其中的兩項,其關聯規則表示為X[?]Y的蘊含式。對于數據庫中的各個事務規則來說,其所占的總事務百分比就是該規則的可信度??梢姡瑢τ陉P聯規則的挖掘主要是通過對數據庫的事務間的關系進行關聯。在虛擬網絡環境下,對于各類關聯規則的挖掘,有助于我們從學生的學習行為中來挖掘關聯關系,對于這些關聯關系進行關注,從中來轉變和調整教學策略,增強學生對知識的學習融合度,更好的提升教學效率。為此,可以通過對課程資源進行關聯規則挖掘,通過學生訪問量,以及學生的學習成績進行對比,從中發現成績與那些資源的訪問有關系,并從學習資源的重組中來增強學生的訪問量。如對于某些訪問量不高的資源,在與學生的成績關聯上作用不大,可以進行有選擇性的刪除,避免占用學生的學習時間,也提升了資源整合的效率。
1.3分類算法
對于數據挖掘中的數據分類是基于某一共同特性而建立的數據分組,其分類方法可以是基于學生的某類學習行為,也可以是針對某一個體或群體。以決策樹為例,對于分類方法的運用主要從分類規則的設定中,以判斷各決策樹的結構是否健壯,對于分類對象的屬性定義是否準確,能否加快決策樹的訪問速度。對于學習行為進行分析時,分類算法可以預測學生的學習成績,并從中來關聯學習動機。如針對學習積極性較低的學生,可以從補救措施的激勵上來增進參與度。對于決策樹在構建分層教學模型中,依據決策樹的層次關系來優化教學內容,能夠更好的促進分層教學效率。同時,對于決策樹的D3算法分類,可以從學生數據庫進行學習能力分類,便于教師采取相應對策來改善學生的學習態度。
1.4時間序列分析
對于學習環境中的學生學習狀態的分析是實時的,其產生的數據量也是按照時間序列進行排列的。因此,在進行學習行為分析時,可以從時間序列來動態的收集學生信息,及時發現學習行為中的問題,并靈活調整教學資源來優化虛擬教學。時間序列是數據挖掘中的重要技術,如在學生課程資源的挖掘中,能夠結合訪問時間、教育資源的關鍵詞進行檢索,以分析學習者的學習行為及趨勢,通過反饋來重新編排和優化教學內容,提升教學資源的利用率。如在時間序列分析中可以完成練習作業的布置,結合學習者對相關課程的跟蹤數據,從而明確練習的重點。在Moodle平臺上,借助于對學習者行為數據的挖掘與分析,可以預測學生對某類知識的掌握程度,從而有針對性的開展作業輔導。另外,在對系統進行檢測時,可以利用前饋神經網絡(FFNN)、支持向量機技術(SVM)、概率集合SFAM分類器來進行準確分類,提升時間序列的分析優勢。
2 基于用戶的學習分析技術實踐
基于學習管理的各類分析工具的應用,對于提升高等教育,尤其是遠程教育改革中發揮了重要作用。以某院校網絡教學為例,通過對各指標數據的分類挖掘,如“上網人數”、“登陸次數”、“在線時長”、“瀏覽資源次數”、“論壇發帖總數”等有關學習行為的匯總,來反映學生網絡學習的頻度、進度、以及均衡性,并從組織、引導和改進上來優化網絡資源結構,跟蹤學生的學習行為。通過數據挖掘技術在學習分析中的應用,能夠從教學上獲取各類活動的總量及平均情況,以監測網絡學習工作現狀,為教學評估和網絡教學實施提供參考。
2.1 課程資源瀏覽情況分析
結合《開放教育學習指南》要求,對于網絡課程模塊的監測與分析結果中,能夠清晰的反映各類資源瀏覽的頁面個數、各學習者對各模塊及內容的關注程度;如對于瀏覽頻次較高的資源頁面,表明受到學習者的關注。在課程章節設計、體驗區,問題庫、以及資料庫等模塊使用分析中,學生的學習習慣能夠從其參與度、個人人均瀏覽頻次等參數中來獲得。如對于各章節內的資源訪問量較高,說明學生從課程的學習及體驗需求較高,學習者在模擬的體驗區能夠參與到網絡互動,激發學習興趣;對于問題庫的訪問量也較大,說明學生能夠從常見問題的解答中來釋疑解惑,便于學習者盡快掌握網絡學習方法。endprint
2.2 自主學習路徑分析
對于學習過程靜態信息的獲取,可以幫助我們從中來梳理學生的“自主學習路徑”。以聚類算法為例,通過對網絡資源模塊的訪問跳轉進行分析,以“瀏覽時間+學號”作為鍵值,以“瀏覽順序”為序列,以“瀏覽模塊”為預測值來建構挖掘結構,從中來獲得各模塊信息的轉換情況,從中來獲得學習者的自主學習路徑。如在“課程章節”與“體驗區”模塊的對比分析中,學習者的跳轉訪問概率較低,而在“資料庫”與“問題庫”等輔助模塊中,學習者的跳轉概率較大,說明學生對學習方法的了解較為側重,也為我們進一步優化課程鏈接,拓寬學習資源提出了要求。
3 結語
隨著對數據挖掘領域的研究深入,對于計算機技術與心理學、教育學的知識的融合更加緊密,因此從數據挖掘的專業化上,依據現代專門教育理論,從學習分析的心理認知、行為認知中進行闡釋將會成為主流。同時,對于現有數據挖掘交互信息的分類,一方面從課程資源的訪問上來探索學習規律,另一方面從學生認知、社會層面來對學生的學習行為進行跟蹤和提取,加深對其剖析,揭示隱藏的知識信息以改善教育決策。另外,在數據挖掘個性化上,對于傳統的依據學生行為的分析,難以從總體情況上來提升教學決策參考,而Siemens教授從構建學習者模型視角,分析學習者的學習過程,從中來獲取某一類學生的特征值,以提供個性化的教學服務。對于學習分析技術中的數據挖掘運用,重在從數據誤解方法上來提升教育資源的針對性、可操作性和靈活性,滿足各類學生的不同需求。
參考文獻:
[1] 魏順平.學習分析技術:挖掘大數據時代下教育數據的價值[J]. 現代教育技術. 2013(02).
[2] 魏雪峰,宋靈青.學習分析:更好地理解學生個性化學習過程——訪談學習分析研究專家George Siemens教授[J]. 中國電化教育. 2013(09).
[3] 孫洪濤. 學習分析視角下的遠程教學交互分析案例研究[J]. 中國電化教育. 2012(11).
[4] 吳青,羅儒國.學習分析:從源起到實踐與研究[J]. 開放教育研究. 2015(01).
[5] 胡藝齡,顧小清,趙春.在線學習行為分析建模及挖掘[J]. 開放教育研究. 2014(02).
作者簡介:楊鳳霞,女,河南開封人,1979年3月生,講師,碩士研究生,研究方向:計算機應用,云計算。endprint