熊筱芳 于麗娜 黃云 胡淑紅 周艷杰
摘要:本文描述了如何利用數據挖掘(DM)技術,分析了各種模式的在線學習行為,并對學習成果進行了預測。本課題組利用統計模型和機器學習DM技術對17,934個服務器日志進行了分析, 調查了南昌高校的98位本科生在網上學習的行為過程,從學生的行為模式和喜好等方面科學地區分了主動學習者和被動學習者,并發現了性能預測的重要參數,得出“數據挖掘技術輔以在線導師的指導,可以提高網上教學和學習的效率”的結論,給教學設計和課件開發提供了參考建議。
關鍵詞:教育數據挖掘 在線學習行為 網上學習活動 在線學習的預測
一、介紹
網上教學和學習很難讓教師觀察到學生的學習行為,如果教師能動態和科學地觀察、跟蹤學生的上網行為,他們可能得到自適應反饋、個性化的評估以及更個性化的關注。目前,在線導師主要側重學習管理系統(LMS)或課程管理系統(CMS),認為它們能提供學生的活動情況,如登錄頻率、訪問歷史和在論壇中的提問。但實際上,這種數據信息只能幫助在線導師在一定程度上了解學生的網上學習進度。
由于了解學生的活動對在線學習的效率起著至關重要的作用,所以找到科學的方法必然能夠更好地在網絡環境中觀察和監測學生的學習活動。LMS/ CMS自動收集和儲存功能在服務器日志是一個很好的資源,它可以幫助教師了解學生虛擬學習的行為。如通過課程網站的鏈接選擇序列以及服務器日志統計分析,將有助于教師發現學生的學習模式,如誰訪問了課程網站、訪問了多久、網站是如何被使用等。
數據挖掘(DM)包括一系列的數據分析技術,適用于從原材料日志數據中提取知識,目的是分析服務器日志,從典型模式的在線學習行為上構建知識,進一步探索數據挖掘技術的獨特優勢,以支持動態的在線指導,并建立在線學習的預測模型。目前,它已廣泛運用于商業中。
DM技術在教育技術的研究主要集中在算法的開發上,而不是教育運用。顯然,DM技術的教育研究還有很大的潛力,如:①本科生有哪些典型的在線學習行為?通過數據挖掘技術能發現什么?②本科生網上學習行為的典型模式是什么?③什么是網上學習環境的學習成果中最重要的預測指標?
二、研究設計和方法
這項研究是在江西科技師范大學計算機應用四年制本科生中展開的,課程是通過學校網站在線學習平臺進行管理的。運用基于項目學習(PBL)的方法,在線學習體驗需要學生之間的積極合作,而且98位學生在線學習行為連續六周被記錄在服務器日志中。從LMS中一共檢索到17,934條服務器日志,筆者對此進行了研究和分析。
圖1顯示了本項研究的數據準備和分析過程。首先,從LMS服務器中進行搜索查詢語言(SQL)來查詢和檢索各種數據,然后日志記錄會被保存到Oracle10G Express數據庫管理系統中。接下來,是數據預處理、檢索和分析過程,包括以下Web使用挖掘過程,即數據預處理階段、數據挖掘階段、模式的分析階段。
數據預處理過程使用精簡的日志文件,它能刪除原來的LMS常見的日志文件中所有沒用的文件、不規則的和丟失的數據。在最初的預處理過程中,會話過濾器會被運用到為特征提取而減少日志的文件中,該過濾器的目的是把一個會話中所有用戶的請求聚合成一個單一的變量集。如學生登錄到LMS,即為一個會話開始,學生按“退出”按鈕,會話立即結束。但是,當學生不小心關閉網頁瀏覽器,或讓網頁閑置超過20分鐘,該會話也將被終止。在這種情況下,已存儲的相關原始數據會從數據庫中刪除,只能反映學生的正常學習活動。
特征提取過濾出以下幾個主要變量:用戶識別、會話標識符、會話起始日期和時間、會話結束日期和時間、用戶的點擊計數和會話持續時間。派生變量(每個學生的數據持續時間和頻率)在每天和每周的基礎上,通過計算或累積提取主變量數據。這些變量會轉化為字段,分配適當的數據屬性,并存儲在數據庫管理系統中。所有的數據字段以表的方式組織起來,并形成一個合理的數據庫。數據挖掘階段包括描述性分析和人工智能分析這兩個子階段:描述性分析用在總結、聚類、關聯規則技術生成數據集,使教師深入了解學生的特點及他們的學習模式;人工智能分析用在預測目的中。
在兩個開源的數據挖掘軟件程序包中,WEKA和KNIME被用來進行描述和人工智能分析,SPSS被用來執行SQL查詢和數據可視化。描述性分析的目的是概述構建所有學生在給定的時間內的行為。處理后的數據通過表格和圖形可視化來說明基本趨勢,使學生更好地了解如何進一步運用數據挖掘技術。
關聯規則被運用于在找到非連續的兩個或更多個變量之間的關系。在這項研究中,關聯規則的一個例子是“行為A→行為B,支持=32%,置信度=80%”,關聯規則的支持意味著觀察到的事件占事件總數的百分比。因此,上述關聯規則意味著在所有分析的事件中,A和B占32%;信心的關聯規則意味著“行為A→行為B”的可能性有多大,即行為A發生行為B的概率。順序關聯技術被運用到我們的研究中,以找出學習行為之間的順序關系,以構建學習模式和喜好。
三、研究結果
從LMS收集的數據被用來描述、統計、分析參與者的登錄頻率、訪問課程材料頻率、發布消息的數量、讀取的消息數和出席同步在線討論的數量。如表1所示,訪問課程材料的登錄次數頻率分布接近正常分布,異步通信的分布(即發布的消息和短信讀取數)和同步通信(即參加同步討論的次數)都偏向正值。據數據顯示,最常見的網上學習活動是登錄到LMS和訪問課程材料,學生往往更喜歡訪問課程材料,與導師或同齡人在線互動的學生較少。
據表1顯示,論壇發布消息數量(M=30.13,SD=29.96)和信息讀取數量(M=44.21,SD=38.08)明顯超過同步討論的頻率(M =2.35,SD= 3.46),t(97)= 9.11,p <0.000;t(97)=11.14,p <0.000。因此,在本項研究中,異步通信工具經常被用作主要的通信方法。此外,學生們傾向于閱讀消息(M =44.21,SD=38.08),而不是發布消息(M =30.13,SD=29.96),T(97)=3.48,p <0.001。
在這項研究中,筆者根據學生常見的學習活動生成了一個三維圖(圖2)來說明下列變量之間的關系:總數發布消息數量(NP)、閱讀消息總數量(NR)、訪問課程教材的總頻率(FAC)。結果表明,一小部分學生訪問教材頻率低,發布的消息數量較少,讀取的消息數量也較少,大多數學生的模式則分散在圖形中。
為了解參與者在課程中的學習時間,研究者從原來的服務器日志中檢索和分析,得出參與者每周一次的登錄記錄是N=3,395。每周子項目統計的截止日期是在6周內的每周星期一晚上12點。
據表2顯示,25.7%的登錄事件發生在周二,也就是每周的子項目開始的第一天;56%的登錄事件發生在周一、周三、周四、周日;18.3%的登錄事件發生在周五和周六。表3說明,在六個星期的項目中,學生在第一周的登錄頻率最高,為22.9%,最后一周是18.1%。
根據學生的共同特征,聚類算法被用來區分同質組學生的分類。根據學生的學習偏好、持續時間、頻率和學習表現等共同特征,K-均值聚類技術被運用到學生的分組中。這個方法基于對個體參與者之間的距離的概念,旨在把接近同一組的學生聚集起來做進一步分析。本研究利用了LMS登錄總數、訪問課程教材的總頻率、發布消息的總數、讀取消息的總數、同步討論的次數、參加的總人數以及用最后成績來描述和分類學生的特點這些變量。
圖3顯示了使用決策樹的分析預測模型的性能,它可以作為一個分類器,從根到葉節點進行分類排序。在樹結構中,葉節點代表類別,分支代表連詞功能及其產生的不同目標值,為我們的研究建立了在線學習表現的預測模型。圖3的右側部分顯示出在6個星期內,學生訪問課程教材高達18.5次,他們的平均成績是77.92分。如果學生訪問課程教材達到44.5次以上,平均成績將提高到89.62分。讀消息的數量是另一個重要的預測變量。如果學生閱讀消息超過66.5條,他們的平均成績將從72.57分提高到88分。總之,當學生更積極參與,即具有較高的訪問課程教材頻率值、發言的數量、讀取的消息數量和同步出席討論的頻率,他們就能取得更好的成績。
四、結語
使用目前流行的LMS,教師能快速得到學生的基本學習資料數據,如登錄日期、登錄頻率、訪問的頁面等,但是它還不具備幫助教師識別個體學習者或小組學習模式的功能、識別成功或不成功學習行為模式的功能、確定預測學習行為幫助學生改進的功能。因此,LMS的開發應結合數據挖掘工具,以利于更有效的網上教學和學習。未來的研究需要把重點放在驗證預測模型上,并把它運用到其他在線學習的環境中。
參考文獻:
[1]Novak, J. D.Learning, creating, and using knowledge: Concept maps as facilitative tools in schools and corporations[M].NJ: Lawrence Erlbaum Associates,1998.
[2]Su, J. H., Tseng, S. S., Wang, W., Weng, J. F., Yang, J. T. D. & Tsai, W. N.. Learning portfolio analysis and mining for SCORM compliant environment[J].Educational Technology & Society, 2006,(1).
[3]Hwang, Y. M., Chen, J. N., Cheng, S. C.. A method of cross-level frequent pattern mining for web-based instruction[J]. Educational Technology& Society, 2007,(3).
(作者單位:江西科技師范大學數學與計算機科學學院)