謝淑敏
(閩江師范高等專科學校,福建 福州 350108)
近年來,隨著互聯網的快速發展,越來越多的人利用互聯網進行工作、學習、娛樂,人們與互聯網的交互產生大量的數據,這些數據正在呈現出爆炸式的增長,人類在不知不覺中已經進入了“大數據”時代。“大數據”是指以多元形式,從許多來源搜集而來的龐大數據組。它具有四個方面的特點:數據體量巨大(Volume)、數據類型繁多(Variety)、實時性強(Velocity)、真實性高(Veracity)[1]。大數據是一個廣義的概念,不存在定義性質的量,它是眾多信息渠道的綜合體系,這種體系通過互聯網技術來實現網絡數據一體化。在教育領域中,可以從微觀視角去理解大數據的內涵。大數據的“大”,可以不是數據的“大容量”,而是分析數據的“全面性”和潛在的“大價值”。教育中的大數據分析,可以對學生學習過程的微觀表現進行測量,深層次挖掘有價值的數據信息,揭示隱藏在其中的學習行為等模式并通過可視化的方式呈現出來。
許多世界知名高校紛紛啟動了教育大數據的相關研究,2012年,美國國家教育部發布了《通過教育數據挖掘和學習分析促進教與學》報告,該報告對教育數據挖掘和學習分析應用領域作了詳細的描述,主要包括學習者知識、行為和經歷建模[2]。其中學習者行為建模主要解決的是學習者不同的學習行為范式與學習者的學習結果相關關系的問題。研究者可以采集學習者與網絡學習平臺的交互數據,通過數據挖掘和分析,探索學習者學習行為與學習者學習結果的相關關系,為提高教師的教學效率和學生的學習成績提供幫助。本研究將利用藍墨云班課平臺獲取學生的學習行為數據,系統、全面地記錄、跟蹤和掌握學生的學習行為特征,通過挖掘數據中有價值的信息,為教師有針對性地實施教學干預,促進教與學提供依據。
為了方便取樣,筆者以閩江師范高等專科學校計算機系16物聯網應用技術1、2班和17數字展示技術(VR方向)三個班級的學生為研究對象,共127人,采用藍墨云班課作為研究平臺,分別在平臺中開設《多媒體技術》和《三維設計技術(3dsMax)》兩門課程,分析學生在課程學習過程中的學習行為特征。為了準確描述學習者的學習行為,本文選取了三個班級在平臺上產生的以下數據:瀏覽課程資源次數、視頻觀看時長、作業成績、參與頭腦風暴次數、參與答疑/討論次數、測試成績等作為學習行為分析的客觀依據,以此為基礎進行學習行為特征分析。每個班級有16個二維關系表,每張表格大約40條數據,我們采用Excel等數據挖掘軟件對這些數據進行分析。
平臺共發布資源50個,主要包括視頻類、圖片類、圖文頁面類等多種類型的資源。瀏覽資源是一種重要的學習方式。對于每門課程,筆者將資源分為視頻資源和非視頻資源兩大類,并在此基礎上統計兩類資源的學習情況。
非視頻資源是教學內容的載體,對于學生來說,查看非視頻資源是一種重要的學習方式。非視頻資源的類型可以是音頻、圖片、文檔、課件等。教師將資源上傳到平臺,學生可以在線瀏覽或者下載使用。對于每門課程,平臺統計了每位學生查看非視頻資源的數量,筆者在此基礎上計算每位學生的非視頻資源查看率,即非視頻資源查看數占非視頻資源總數的比值。統計結果如表1所示。數據顯示的結果表明,有四分之一的學生對非視頻資源的學習積極性不高。

表1 非視頻資源學習情況
視頻是重要的知識呈現形式,學生通過視頻學習可以加深對知識點的理解。對于每門課程,平臺統計了每位學生觀看視頻的時長,筆者在此基礎上計算每位學生的視頻觀看率,即實看視頻時長占視頻總時長的比值。統計結果如表2所示。看視頻是網絡平臺學習中最直接獲取知識的方式,可以反映學生對課程的學習深度,數據顯示的結果表明有一半的學生幾乎不看視頻資源,可以推測,真正發生深入學習的學生很少。

表2 視頻資源學習情況
平臺記錄了平時作業成績,三門課程共開展作業20次,參與756人次,總體平均參與率85%,提交結果845個,總體平均分62.90分,最低分0分,最高分94分,標準差22.27,方差495.79。不同分數段的相關數據統計結果如表3所示。

表3 作業成績統計情況
頭腦風暴是一種線上的,背對背的發言活動模塊,它的核心思想是獨立思考,獨立發言,學生之間互不干擾。平臺共開展頭腦風暴9次,參與281人次,發表觀點281個,獲贊238人次。平臺統計了每位學生參與頭腦風暴的次數,筆者在此基礎上計算了學生的參與度,統計了每個參與度占有的學生人數。統計結果如表4所示。

表4 頭腦風暴參與情況
答疑討論是一種線上的、面對面的答疑或討論的互動模塊,類似于微信群的功能。平臺中每一次教學都設置了若干答疑討論活動,供學生之間、師生之間開展答疑和討論。平臺共開展答疑討論10次,參與276人次,消息總數799個,獲贊65人次。平臺統計了每位學生參與答疑討論的次數,筆者在此基礎上計算了學生的參與度,統計了每個參與度占有的學生人數。統計結果如表5所示。由數據可以分析得出,四分之一的學生參與答疑討論的主動性還有待提高。

表5 答疑討論參與情況
測試主要用來開展課堂小測,平臺記錄了平時測試成績,三門課程共開展測試7次,參與263人次,總體平均參與率85%,交卷總數264個,總體平均分70.52分,最高分100分,最低分0分,標準差28.08,方差788.66。不同分數段的相關數據統計結果如表6所示。

表6 測試成績統計情況
通過收集學生在課程學習過程中產生的日志數據,并對這些數據進行過濾與篩選,得出學生參與活動的情況與學生的學習成績呈正相關的關系。本研究以學生中最高經驗值為基數,超過80%(含)的為優秀,60%(含)至80%的為及格,60%以下為入門。通過統計分析,優秀學生占總人數53.54%,及格學生占總人數29.92%,入門學生占總人數16.54%。優秀學生參與活動的平均次數為14.46,及格學生參與活動的平均次數為10.3,入門學生參與活動的平均次數為8.17,顯然優秀學生參與活動的次數高于及格學生與入門學生。
本研究采用大數據學習分析,實時量化跟蹤學生的學習過程,記錄學生的學習行為,并將學生的行為數據進行可視化呈現,以一種直觀的形式呈現給學生、同伴和教師,使教師了解學生的學習效果,從而開展有針對性的教學活動。下面我們以一位學生在平臺上產生的行為數據為例展開論述。為了保護學生隱私,暫且以A同學命名。如圖1所示,這是A同學在平臺上獲取的經驗值及其分布、參與活動、查看資源、出勤情況的可視化統計。
在大數據分析的支持下,可以全面地記錄、跟蹤和掌握學生的不同學習特點、學習需求、學習基礎和學習行為[3]。在云班課平臺上,學生的學習效果是以其獲得經驗值為參考指標。如圖2所示,動態反映A學生獲取經驗值的過程,圖例中,周增長經驗值是A學生每周相比上一周增長的經驗值,周發布經驗值是教師每周發布的資源和活動的經驗值(不包括點贊經驗值和課堂表現經驗值),學生經驗值是學生總共獲得的經驗值。從圖中可以看出,學生每周的經驗值都在增加,第三周增加的幅度最大。第五周由于教師發布的經驗值明顯降低,學生的周增長經驗值的增長幅度也降低了。最后一周,教師并沒有發布新的經驗值,而學生的經驗值有所增加。從整體上看,說明教師的教學活動對學生的學習行為有一定的影響。

圖1 A同學的經驗值面板

圖2 A同學的經驗值報表
如圖3所示,將A同學經驗值和優秀同學(經驗值超過總經驗值80%的同學的平均經驗值)及同班同學平均經驗值進行對比,我們可以看出A同學各項活動的經驗值均超過優秀同學以及同班同學的平均水平,說明該同學在平臺中的成績較優秀,積極參與班課活動。

圖3 A同學的經驗值對比
教學平臺中學生的參與程度是影響學習效果的重要因素。本研究通過藍墨云班課平臺,獲取學生的學習行為數據,通過學生與學生之間的對比、學生自身學習過程的對比,分析學習行為對學習效果產生的影響。但本研究的局限性還是存在的,首先是樣本太少,只通過三個班級學生的行為數據進行分析,得出的研究結論難以推廣;其次,學生的學習行為會受多方面因素的影響,僅僅從平臺上獲取的數據無法完全反映學生的學習效果。在今后的研究中,將進一步擴大研究的樣本,可以設置實驗組和對照組,進行教學實驗,并融合結構化與非結構化的數據進行綜合研究。