楊蘊昊
摘要:本文對學習網絡課程的行為進行分類,并分別就學習行為數據采集及挖掘分析方法現狀進行了梳理與總結,為完善網絡課程學習行為數據采集模型提供理論依據。
關鍵詞:網絡課程學習;行為數據采集分析
中圖分類號:G642.41 文獻標志碼:A 文章編號:1674-9324(2019)06-0237-02
近年來,隨著信息技術的飛速發展和互聯網技術的全面普及,大量用戶行為數據隨之產生,由此,大數據概念應運而生。結合互聯網技術教學的網絡教育和大數據,驅動教育向個性化、智能化方向發展已成為必然趨勢。如何針對網絡課程學習構建有效的行為數據采集模型,以此追蹤和收集的行為信息,更準確地分析學習者學習風格和學習偏好,優化教學資源配置,支撐各類學習者更好地學習網絡課程,成為了網絡學習領域中非常有價值的研究課題。
一、網絡課程學習行為
網絡學習行為數據的采集模型主要關注兩方面:實際操作行為和知識內化的過程。實際操作行為主要體現為學習網絡課程時的顯性操作,是其進行學習時的外部直接表現。根據目前我院網絡課程中學習者的實際操作進行歸類,大概可分為:媒體操作、記錄操作和共享操作。通過記錄這些學習時的簡單操作,可以了解學習者在何時何地發生了什么樣的學習行為,為評價學習效果奠定基礎。知識內化的過程主要指進行知識加工理解的過程。目前我們的網絡課程中,可以通過留言反饋、學習評價等行為進行此方面數據的采集與分析,挖掘學習者的個性特征,了解學習效果。目前,我們需要的網絡課程學習行為數據采集與學習平臺數據采集略有差異,需要有針對性地進行追蹤并分析。
媒體操作:網絡課程中核心的多媒體資源就是教學視頻,記錄分析視頻學習動作的行為數據就顯得尤為重要。這些操作,又可以大概歸為視頻快進、快退、拖動、暫停、靜音等動作以及視頻觀看時長這兩種類型。記錄視頻中的學習動作發生的位置與頻率,可以幫助教師了解視頻中哪些內容是學生需要多學、難學的。針對觀看時長的數據進行分析,則可以了解到學生看視頻注意力集中的規律,進而能更有效地對教學視頻進行碎片化,適應學習偏好。
記錄操作:在網絡課程的學習過程中會產生大量文本性質的瀏覽記錄,瀏覽的頁面、點擊的次數、訪問持續時間、學習動作順序等,記錄下這些學習動作,有助于了解學生的學習風格習慣,優化教學設計。
共享操作:目前主要指記錄離線下載資源,以及將某個學習頁面收藏到收藏夾中的內容與次數。
留言反饋:目前我們的網絡課程可針對單個知識點或整門課程進行留言反饋,在這兩個模塊收集到的評論、討論、提問、解答、總結等文本信息是了解學習偏好的重要基礎數據。我們需要將這些數據整合分析,進而做到更好地進行個性化服務。
學習評價:在網絡課程設計中,增加了視頻節點測試、知識點練習等,記錄這些節點測試的正確率和錯誤率、完成測試的時間、通過測試的次數等數據,并進行深入分析,得到學習者的學習模式,也可以結合學習者的操作記錄為過程性評價提供有力的數據支持。
二、網絡數據采集分析方法
在采集媒體操作數據方面,東北大學的李帥為了能夠分析出觀看視頻時的暫停信息,采用K-means的聚類算法,對學生在觀看視頻時選擇暫停的位置進行了聚類。通過暫停的位置分析了暫停的原因,進而獲得了需要設置不同視頻清晰度和學生學習難點位置的學習行為需求信息。目前對于記錄操作的采集模型有很多。如較早的有胡運安基于SCORM規范設計的學習行為采集模型,利用后臺數據庫儲存,使用SOAP消息處理、XML數據封裝技術完成數據傳輸。但是他的系統設計僅跟蹤了學習行為,對體現學習者個性的學習行為分析未作更深入的研究。王巧玲在Web服務的環境下,初步設計實現了網絡學習行為采集和集成(EBCI),采集的對象包括:訪問的頁面、訪問開始時間、訪問持續時間、IP地址、訪問次數、訪問頁面的引用頁等。EBCI以服務器端的Web日志中采集Cookie記錄的學習行為作為數據源,不依賴平臺與廠商,利用XML語言作為基礎實現了數據共享,但該技術主要是針對跨平臺數據的收集共享。黃克斌分四個模塊提出了網絡學習行為模型,并設計了一個智能化網絡學習行為分析系統結構。具體到其中之一的數據采集模塊中時,他使用了異步和同步兩種采集方式,來分別進行靜態和動態數據的采集,但只是針對學習行為進行了智能化地分析,沒有提出完善有效的模型系統。張玉芳針對在多用戶、多Web站點的網絡訪問環境下,提出了超文本傳送協議(HTTP)請求與數據清理過濾的采集方法,引入網絡嗅探的方式采集數據,并過濾了大量傳統方法無法過濾的請求記錄,有效地抽取出反映用戶顯式點擊的頁面請求,為下一步的數據挖掘提供了更加準確的數據源。李帥等以本校資源共享課平臺為實例,基于Web日志的數據挖掘,獲得有用的信息。但是服務器日志中儲存的數據大而龐雜,難以針對某項學習行為獲得完整的數據文件,因此作者采用客戶端采集行為數據的方式,將腳本語言嵌套在服務器端,采集學習行為數據對MOOC教學起到了較大的幫助。在留言反饋的采集模型方面,夏天以論壇中的公共網絡輿情數據采集為例,利用聚焦網絡爬蟲技術,通過限定爬行方向,引入頁面繼承,實現互聯網數據的深度定向采集。采集到的數據包括用戶發布的話題、評論以及涉及的圖片等隱性行為。但是研究采用的爬蟲技術只適用于評論類行為,不能采集到總結反思等隱性行為。收集學習評價的學習行為數據時,魏德生通過對網絡學習行為的分析,依據檔案袋評價的啟示,以安全性和穩定性都較好的Tomcat作為服務器,以SqlServer2000為后臺數據庫,設計了學習行為數據自動記錄和結果統計展示的監控系統。該系統可以自動記錄測試情況,并進行深入地數據挖掘。馬瀟同樣采取了Web日志挖掘的技術收集數據,引入層次分析法,對學習態度、學習方法、學習過程三個一級指標設置權重,從而對網絡學習者進行綜合評價。但是他只給出了評價信息自動采集的設計思路,沒有具體實現。元帥將在線學習行為分析評價模型分為采集、統計、分析三個模塊,采用基于Web服務和Web日志,使用不同的數據庫支撐的方法進行采集和統計。同時,通過設置評價指標的權重和加權平均法分析學習結果、采用非量化評價和分類數據挖掘進行學習方式評價。此外,還有一些研究對知識內化過程的采集和挖掘進行了綜合設計。我們在建設網絡課程學習行為數據模型時也做部分參考。劉均等較早地提出了一種面向個性化網絡學習的學習者個性挖掘方法,通過分析樣本學習者個性特征與學習行為模式,挖掘出關聯規則,進而推理之后的行為模式,動態地獲取其個性特征。這個方法已經基于CMI示范系統進行了驗證,實現了學習個性的自動獲取。王志梅等文章中提到了E-learner檔案模型的建立,該模型使用Agent監控學習行為數據,通過不同特征的學習行為來評估學習特征,構建電子檔案袋系統供定制分享。呂莉也提出使用Web服務技術及移動Agent技術采集網絡學習行為。廖競等結合基于Web服務和Web日志挖掘的數據采集與分析方法,在服務器或網關上使用netmate進行數據流捕獲,處理并輸出為文本,然后使用文本挖掘的成熟算法進行處理,得到網絡學習者學習的特點、偏好等學習規律,幫助教育者進行教育學分析,從而有效指導網絡學習和教學的建設。這個基于數據流獲取的網絡學習行為數據采集與分析的方案系統具有較強的靈活性和實用性。陳紅珍在網絡學習行為相關研究的論文中設計了一種采集方法:采用點擊流數據倉庫技術對學習行為進行采集挖掘,來更好地了解學習者的個性和狀態。點擊流數據倉庫是指把日志里記錄的大量點擊行為的數據再加工,形成面向分析的、體系化的、綜合的數據倉庫(DW)。DW可以在描繪學習者行為視圖和存儲大量歷史數據的基礎上,進行學習行為分析。
三、總結
網絡課程在面向全社會學習者的同時也產生了海量的數據,建議在采集、提煉這些龐雜的教育數據時,針對不同種類的數據使用不同的采集方法。對于媒體操作,可以使用K-means聚類算法對數據庫中的對象集合分割,再挖掘數據中的信息;針對操作記錄主流的采集技術有Web服務、Web日志挖掘、Agent等;留言反饋的數據采集可以使用聚焦網絡爬蟲技術;收集學習評價的學習行為數據時,可以使用網絡學習行為自動監控系統中的技術統計挖掘數據。綜合多種手段,以期能更好地追蹤和收集學習者行為信息,更準確地分析學習者學習風格和學習偏好,從而優化資源配置,適應混合式教學需要,配合建立多元化學習評價,提供個性化服務,最終提高教學質量,滿足各類學習行為的需要。
參考文獻:
[1]王巧玲.基于Web服務的網絡學習行為采集與集成初步設計與實現[D].華中師范大學碩士學位論文,2007.
[2]魏德生,楊雪.網絡學習行為自動監控系統的設計與實現,教育信息化,2006,(1).
[3]廖競,張暉.一種靈活的網絡學習行為數據采集與分析系統,信息與電腦,2011,(1).