摘要:采用非負矩陣分解特征抽取方法對在線課程平臺所記錄的學習數據進行降維與壓縮,提取影響在線課程平臺上學生學習質量的主要特征群集。結合群集特征,根據學生個體的學習行為指標及反映學生學習效果的特征指標的權值大小,依次選取多級特征指標,形成教育特征群集網絡,進而分析可得影響教育個體質量的核心特征指標。
關鍵詞:特征抽取;非負矩陣分解;群集;特征指標
0. 引言
國外學者較為重視在線課程平臺數據資源的研究,在Instructional quality of Massive Open Online Courses'—文中,分析了在線課程平臺教學設計的質量,隨機抽取76個大規模開放在線課程的數據資源,分析和比較在線課程平臺的教學設計質量。此外,還有一些研究者將注意力集中到在線課程學習平臺的學習評價和最終學分評定問題上,基于COURSERA等大型慕課平臺積累的學習數據,對平臺的"學生互評"評價方式做了分析,論證其合理性和有效性。國內關于在線課程平臺的數據資源的研究大多也集中在2012年之后。北京、上海、廣州等地已經利用新的數據信息處理手段為用戶提供基本公共教育服務。如北京教育音像報刊總社在北京市教委的領導下,開發了“名師在線”服務平臺,并可提供后臺數據分析報表。
本文針對教育個體學習特征的完整數據鏈,采用特征抽取方法提取出影響教育質量的主要群集特征,構建教育特征數據網絡,并可進一步分析得到影響教育個體質量的核心特征。
1. 非負矩陣分解特征抽取
結合本文在線課程平臺教育特征數據群集分析問題,要求各學習特征節點隸屬于某個群集的程度值或權值,不能為負值,因此適用于非負矩陣分解(Non-negative Matrix Factorization, NMF)算法[1-2]。NMF方法是由Lee和Seung在《Nature》上提出, 它使分解后的所有分量均為非負值,能使數據的維數得到一定程度的約減,克服了傳統矩陣分解的很多問題,具有實現上的簡便性、分解形式和分解結果上的可解釋性,以及占用存儲空間少等諸多優點。
2. 群集特征分析
群集是指系統中相互吸引的高度聚集的狀態或現象,普遍存在于自然界和人類社會。在教育特征數據中,連接權重大的學習行為節點構成群集,表示該學習行為相關性高。找出教育特征數據中的群集,即可找到表征學生學習個體行為的核心特征。
NMF方法中的V=WH,其中V是由m個學生樣本和其n個學習行為特征構成的數據集矩陣,W是分解得到的大小為m*k的特征矩陣,H是分解出的大小為k*n的系數矩陣[3]。如對采集到的學生個體教育特征數據進行NMF分解,得到3個群集特征的權值如圖1所示。
由學生個體行為及學習效果的指標的權值大小,結合群集特征大小,可依次選取多級特征指標形成教育特征群集網絡。
3. 教育特征群集網絡構建
群集特征的差異表明,網絡呈現出明顯的層次拓撲結構,大多數節點分別依附在若干個節點上,形成若干個小網絡,小網絡經過選擇性的互聯形成大網絡并產生少數幾個中心節點,最后這幾個中心節點互聯成完整的網絡[4-6]。
將采集到的學生樣本的特征數據通過上節NMF方法分解,可得到的群集特征,結合學生個體的學習行為指標和學習效果指標,可構建學習教育特征網絡如圖2所示。
由圖2可知,節點1、3和節點4相關性較大,構成一個群集特征,其中各節點分別對應各教育個體的行為指標特征或效果指標特征。通過NMF分解得到的權重大小,可對節點1、3、4進行權重排序,分析出更為重要的核心節點及所對應的指標。同理也可對位于同一個群集的節點2、5、6及節點7、8、9進行分析,從而可得到影響教育個體質量的核心特征指標。
4. 結論
本文研究了基于NMF的特征抽取方法提取影響學生質量的核心特征;根據這些反映個體質量的群集特征的權值大小,可幫助教師分析學生個體學習質量的核心指標,歸納在線教育環境下有效教學活動發生的條件與關鍵要素,為構建有效教學模式提供理論與實踐基礎。同時,在此分析基礎上,可進一步有效地設計規則來激發學生主體的主動性、積極性,為學生提供更有針對性的教學干預。
參考文獻:
[1]張小林,基于高斯混合模型和非負矩陣分解的復雜網絡社區檢測[D]. 西安電子科技大學,2014.12. 33-42.
[2]李樂, 章毓晉. 非負矩陣分解算法綜述[J].電子學報, 2008, 36(4): 737-743.
[3]Wang F., T Li, X. Wang, et al.. Community discovery using non-neg ative matrix factorization[J]. Data Mining and Knowledge Discovery, 2011, 22:493-521.
[4]徐曉,張清,張玉來,張世波.論復雜網絡理論在教育技術領域的應用[J]. 寧波大學學報(教育科學版),2014,36(6):89-93.
[5]吳增海.社交網絡模型的研究[D].中國科學技術大學, 2012,5:50-62.
[6]黃麗蒂.基于群集風險理論的體育建筑看臺安全設計研究[J]. 哈爾濱工業大學,2014.7.23-43.
支撐項目:2017年武漢市教育局高校教學研究重點項目(2017008)
作者信息:周靜,湖北襄陽,副教授,博士,江漢大學,數據挖掘與分析及計算機教育,湖北省武漢市沌口經濟開發區江漢大學數學與計算機科學學院,430056。