吳 青羅儒國王權于
(1.武漢大學 教育科學研究院,湖北武漢 430000;2.中國地質大學 遠程與繼續教育學院,湖北武漢 430000)
基于關聯規則的網絡學習行為實證研究*
吳 青1羅儒國1王權于2
(1.武漢大學 教育科學研究院,湖北武漢 430000;2.中國地質大學 遠程與繼續教育學院,湖北武漢 430000)

學習者在遠程教學平臺中遺留的大量數據,體現了學習者的個性特征和知識建構過程。但由于遠程教學實施過程中指導教師精力有限、學習過程缺乏監管等,導致這些數據并未得到充分利用。文章選取某繼續教育學院遠程教學平臺中存儲的網絡學習行為數據,基于關聯規則挖掘出學習風格、學習行為和學習成績之間隱含的內在規律,并轉換為有利于教學決策和教學過程優化的知識,以幫助不同風格的學習者改善自身學習行為,同時便于教師在不同類型的遠程教學過程中結合學習者的風格差異完善教學過程。
網絡學習行為;學習風格;學習成績;關聯規則
國內研究者大多從宏觀定性視角界定“網絡學習行為”,強調它的教育學內涵。而國外研究者大多從微觀定量視角來界定,特別突出網絡學習行為的可觀察性和可測量性。本研究認為,網絡學習行為是學習者為了達到學習目標,利用計算機、網絡或其他媒體工具,基于網絡學習平臺提供的學習資源進行學習和人際互動,為獲取知識而產生的一系列網絡操作的總和。因此,網絡學習行為分析的最終對象是一系列網絡操作。
網絡學習行為的研究主要包括學習者行為建模和學習成績預測兩個方面。學習行為建模著眼于學習者不同的網絡學習行為范式與網絡學習成績的關系,重點突出網絡學習行為范式的差異。其研究者大多具有人文社科背景,偏向于構建描述性、定性的網絡學習行為模型,目的在于解釋網絡學習的使用態度、學習偏好等重要潛在變量[1]。部分研究者以網絡學習者形成的社會網絡結構為切入點,探討不同類型的學習交互模式及其特點[2]。然而,上述研究一般通過發放調查問卷或訪談的形式調查學習者的網絡學習行為,沒有充分利用網絡學習系統中遺留的數據,構建的模型大多僅適用于該次實驗,可推廣性較差。
學習成績預測關注學習者當前網絡學習行為和未來學習成績的關系,側重于學習成績預估和落后學習者預警。其研究者大多具有理工科背景,基于網絡學習過程數據,利用分類器[3]、回歸演化算法[4]等多種數據分析方法,挖掘出學習成績預測模型,其研究成果過多關注各種算法的準確度、敏感度、顯著性水平等評估差異,較少結合實驗結果分析背后體現的教學特征和教學規律。此外,由于學習者的個性差異,具有相同學習行為的不同學習者有可能獲得截然不同的學習成績,而上述研究者大多孤立地研究網絡學習行為與學習成績之間的關系,他們在探究學習行為對學習成績的影響時,并未考慮學習者的個性特征。
1 研究問題
體現學習者個性特征的因素有很多,其中學習風格代表了學習者學習偏好和信息處理的個體差異,是感知、互動和適應學習環境相對穩定的指標。一些學者認為學習風格對學習成績具有決定性作用[5],但對影響程度尚未形成一致性結論。例如,部分研究成果指出同化型學習者和發散型學習者在概念圖上比較有創作力[6],而其他研究證明發散型學習者表現最好[7],或適應型學習者容易產生較為豐富的學習成果[8]。
雖然上述研究對學習風格與學習成績的關系并未達成一致性結論,但都指出學習風格作為學習者內隱的個性特征,決定了學習者的信息處理偏好,影響了學習者的學習行為。而網絡學習行為作為學習者信息處理偏好的外顯操作,可以作為學習成績預測的基礎。因此,本研究以學習風格為切入點,重點研究不同風格學習者的哪些網絡學習行為將有助于獲取較好的成績。
2 研究對象
本研究基于學習風格混合測量方法[9],從武漢某高校繼續教育學院2012級計算機技術專業挑選出154位學習風格顯著的學習者,組織他們參加2013年9月至2014年5月“Java語言與面向對象程序設計”課程的遠程學習,將遺留在教學平臺中的網絡學習行為數據作為研究對象。
3 研究工具
本研究選擇數據挖掘軟件WEKA(Waikato Environment for Knowledge Analysis)作為學習分析工具。該工具是一款新西蘭政府支持的智能分析開源項目,在金融、醫療、交通等多個領域均有廣泛運用,可以直接連接系統數據庫,能夠實現異構數據源的無縫整合。
4 研究步驟
(1)數據收集
本階段需實現網絡學習行為數據的選擇和捕獲。網絡教學過程由自主學習和協作學習兩部分組成。自主學習行為通過記錄學習者瀏覽在線課程視頻、電子教案等教學資源時花費的時間,以及在線作業的完成情況,保存于在線學習系統中。協作學習過程前后共組織了4次,由4到5名學習者組成一個討論組,根據教師提供的主題或者結合作業中的問題開展協作討論。教學平臺的在線聊天室和論壇借鑒了匹斯堡大學EPSILON系統中使用的句首詞分類系統[10],學習者發言時需要首先選擇此次發言的句首詞(例如選擇句首詞“我同意,是因為”,來表明此次發言為“discuss類型”幫助系統識別和理解學生的會話意圖)。協作學習行為以不同類型發言的次數和字數的形式存儲在論壇和在線聊天室中。此外,由于接受遠程教育的學習者大多為年齡跨度較大的在職人員,為了提高專業素養或學歷,他們往往利用業余時間參與學習。與全日制學生相比,人口統計學屬性對于他們的成績獲取影響較大,這就使得學生基本信息管理系統中的個人基本信息也變得至關重要了。綜合考慮上述因素,可知網絡學習行為數據由自主學習數據、協作學習數據和人口統計數據共同組成。
(2)信息處理
不同風格學習者的哪些網絡學習行為將有助于獲取較好成績的命題,可歸結為在學習風格一定的前提下,分析網絡學習行為和學習成績之間的關系。基于關聯規則挖掘技術,可以得到一個“如果學習風格為某一類型,并且擁有特定網絡學習行為,那么學習成績將達到某種程度”的規則,從而揭示風格、行為和成績之間未知的依賴關系。
首先將已收集到的網絡學習行為數據采用無監督屬性離散方法中等頻區間裝箱法(Equal-frequency Binning),分別離散成為優、中、差三大類。例如屬性test被離散為3個區間(-inf-78],(78-84],和(84-inf),每個區間的人數基本持平。
接著,運用關聯規則挖掘算法,從數據中抽取學習風格、學習行為和學習成績之間的依賴關系。關聯規則挖掘算法包括序列模式挖掘、結構模式挖掘和頻繁項集挖掘三大類。由于本研究并未考慮網絡學習行為之間的順序關系,因此不適合用序列模式挖掘;而結構模式挖掘的研究對象必須是圖、樹等結構化數據集合,故對本研究也不適用。基于此,本研究選擇頻繁項集挖掘中應用較為廣泛的Apriori算法,來開展關聯規則挖掘。
(3)知識應用
一方面,基于抽取的學習規則歸納出適合不同風格學習者的網絡學習方法,便于學習者了解當前學習狀態,及時反思學習過程中的不足,為自我改善學習行為提供參考。另一方面,總結與風格相匹配的教學指導方法,在跟蹤和分析學習者的網絡學習行為時,幫助教師選擇有針對性的教學資源,提供合理的教學提醒,為實施恰當的教學干預提供理論依據。
1 數據收集
網絡學習行為數據由人口統計屬性、人機自主學習屬性、人人協作學習屬性以及期末測試成績組成。其中,人口統計屬性記錄了學習者的性別 sex,年紀 age、學歷背景bg和學習風格learningStyle。人機自主學習屬性記錄了學習者在瀏覽課件、視頻時總耗時duration和平時作業的平均成績homework。人人協作學習屬性記錄了學習者在網絡協作學習過程中,不同類型言論的發言總字數和所有發言的總次數,從而體現學習者對不同會話層次的貢獻程度,其中言論類型借鑒EPSILON系統中的句首詞類型系統包括促進類型motivate、信息共享類型inform、討論類型discuss、請求類型request、任務類型task、確認類型acknowledge和維持對話類型maintain。期末測試成績記錄了學習者的期末考試成績test。
2 信息處理
本研究運用Apriori算法,選擇產生50條規則,即關聯規則數numRules=50,每次支持度遞減的數量delt=0.05,將置信度作為準確性的衡量標準,衡量標準的最小值minMetric=0.7。利用WEKA提供的Apriori規則挖掘功能,得到的結果如圖1所示。

圖1 網絡學習行為關聯規則挖掘結果
針對挖掘分析得到的前50條規則,篩選其中前件和后件中包含學習風格屬性或者具有一定教學指導意義的規則,共計14條。
(1)與學習風格無關的普適性規則集合及其注釋

規則①:如果學習者自主學習時間較長,平時作業成績較好,那么其期末測試成績較好。

規則②:如果學習者協作頻率較低,平時成績較差,那么其期末測試成績較差。

規則③:如果女性學習者期末測試成績較好,那么其前期學歷為計算機相關專業。

規則④:如果學習者協作學習頻率較高,那么其花費在自主學習的時間一般。

規則⑤:如果學習者較多參與討論和信息共享,那么其發生協作學習的頻率較高。

規則⑥:如果學習者情感類型發言字數較多,那么其發生協作學習的頻率偏高。
(2)分散型學習者相關規則集合及其注釋

規則⑦:如果分散型學習者的期末測試成績較好,那么其自主學習時間較長且提出的問題和討論較多。

規則⑧:如果分散型學習者協作學習頻率較低,那么其期末測試成績較差且前期學歷非計算機相關專業。

規則⑨:如果分散型學習者自主學習時間較長,那么其前期學歷非計算機相關專業。
(3)聚斂型學習者相關規則集合及其注釋

規則⑩:如果聚斂型學習者自主學習時間較長,較少參與協作討論,但協作討論時會表達自己的情緒,那么其期末測試成績較好。
(4)適應型學習者相關規則集合及其注釋

規則?:如果適應型學習者較少參與討論類發言,那么其期末測試成績偏低。

規則?:如果學習者協作頻率較高且積極參與信息共享類發言,那么大多為適應型學習者。
(5)同化型學習者相關規則集合及其注釋

規則?:如果是男性同化型學習者,那么其較少參與情感類和信息共享類協作討論。

規則?:如果同化型學習者自主學習花費較多時間,那么其容易獲得較好期末測試成績。
3 知識應用
(1)適合不同風格學習者的網絡學習方法
通過上一階段處理可知,學習風格和學習成績之間并不存在直接關聯,但學習風格差異影響了學習行為,而學習行為將在一定程度上決定學習成績。由規則①②可知,人機自主學習是影響期末測試成績獲取的關鍵,但人人協作學習參與度過低可能導致該成績不夠理想。
不同風格學習者適合的網絡學習行為各具特色,學習者可以對比自身學習行為和理想行為之間的差異,及時調整完善學習過程。例如,分散型學習者擅長收集學習資料,但學習專注力可能相對渙散,根據規則⑦,可以在保障自主學習時間的前提下,加強問題總結和梳理能力將有助于成績的提高。聚斂型學習者多共享信息并且發表情緒類言論,能夠在融洽的學習氛圍中彌補獨自學習的孤獨感,有利于產生更多更有創造力的新觀點,如規則⑩。適應型學習者偏好在積極學習討論中提供信息,如規則?;倘若協作層次不夠深入則不利于獲取理想成績,如規則?;而且類似的網絡學習行為,對于不同風格學習者可能獲得截然不同的學習成績,如規則?。同化型學習者只要自主學習時間得到保障,無論是否參與協作討論,都比較容易取得較好成績,而分散型學習者卻不是這樣,如規則⑧。因此,學習者需要掌握自身風格特征,揚長避短,促進在線學習行為的自我監督和調控,使得網絡學習成為具有計劃性、獨立性和自我監控性的學習過程。
(2)適合不同風格學習者的網絡教學方法
教師作為網絡教學的引路人和輔助者,應該把學習的主動權交還給學習者。教師的參與方式主要包括四種:一是設定交互主題、組織學習路徑,二是回答學習者所提問題,三是監督、鼓勵學習者積極參與學習討論,四是潛水觀察、不做回應。
對于第一類參與,指導教師需要重點考慮主題的開放性、與網絡課程內容的契合性和趣味性等。如規則④⑤⑥所示,協作學習參與度若只是由低層次協作組成,可能會占據學習者的自主學習時間。因此,教師需注意主題趣味性和實用性之間的平衡關系,補充合適的學習材料,提供學習向導以及學習范例樣板。
對于第二類參與,教師應引導學習者自行得出結論,而非直接給出答案,避免學習者養成依賴心理。對于不同風格學習者,其引導方式略有差異——分散型學習者普遍好奇心強,愿意成為學習討論的核心,如規則⑦⑧,教師可以為他們提供各種討論和知識應用的空間;聚斂型學習者偏好解決實際任務和難題,而不喜歡社會性問題和人際關系,如規則⑩,教師可以為他們提供較為深入而多樣的學習材料,并鼓勵他們積極參與協作討論;適應型學習者傾向于主動實踐和依賴具體經驗,如規則?,教師可以向他們提供豐富的案例知識,輔助他們得出結論。指導教師只有結合學習者的個性特征,開展個性化學習引導,才能維持學習熱情、指引學習方向、調控學習進程、擴展學習深度、滿足不同學習需求。
對于第三類參與,教師的情感參與可以滿足學習者被尊重以及自我實現的需求。遠程教學平臺成為情感溝通、信息交流與知識討論相融合的場所,可以增強學習者對網絡學習環境的歸屬感,激發學習動機和參與意識。對部分聚斂型學習者而言,恰當的學習情感交流能夠促進學習積極性,提高思維活躍度,深化對問題的理解,如規則⑩。否則,可能會出現如規則②那樣的情況,學習者參與意識不高導致成績不佳。
對于第四類參與,教師雖然沒有和學習者發生直接交互,但有利于掌握他們的個性特征,了解當前學習進展,便于下次學習討論的合理分組。不同風格學習者的協作學習行為差異較大,如規則??,分散型和適應型學習者更傾向于參與積極討論,而同化型和聚斂型學習者更愿意傾聽他人意見、更喜歡獨自思考。讓學習者自由選擇分組,他們往往會選擇相互熟悉的同學組成小組,容易出現討論過程中一言堂、搭便車的現象,會直接影響學習效果,出現如規則④那樣的情況。因此,教師可以通過觀察參與者的學習表現,掌握其學習風格,為實現組內異質、組間同質的協作分組提供基礎。
學習者的學習風格通過影響網絡學習行為決定學習成績的獲取。一方面,從網絡學習方法來看,分散型和適應型學習者需提高協作學習層次,加強問題的總結和梳理能力,而活躍的聚斂型學習者更容易取得好成績;協作學習表現對同化型學習者影響并不大,自主學習效果是其獲取成績的關鍵。另一方面,從網絡教學方法來看,教師在設計網絡教學過程時,需平衡趣味性和實用性之間的關系;在回答學習者問題時,需結合學習者不同風格,引導學習者自行得出結論;在鼓勵學習者參與討論時,需特別關注聚斂型學習者;在組織協作學習時,需根據學習風格差異劃分協作小組。
本研究由于人數有限,其研究結果的準確性和普適性有待進一步精化。此外,由于學習分析技術受限于數據收集范圍,數據大多來源于遠程教學平臺或瀏覽器數據,并未捕獲學習者在離線狀態下現實情境中的學習行為。因此,如何利用可穿戴計算等前沿技術,擴大數據捕獲范圍,從而深入了解網絡學習的全過程,是未來工作的研究方向。
[1]武法提,牟智佳.電子書包中基于大數據的學生個性化分析模型構建與實現路徑[J].中國電化教育,2014,(3):63-69.
[2]Brooks C, Erickson G, Greer J, et al. Modelling and quantifying the behaviors of students in lecture capture environments[J]. Computers & Education, 2014,75:282-292.
[3]Ruipérez-Valiente J A, Mu?oz-Merino P J, Leony D, et al. ALAS-KA: A learning analytics extension for better understanding the learning process in the Khan Academy platform[J]. Computers in Human Behavior, 2014,(4):90-101.
[4]馬杰,趙蔚,張潔,等.基于學習分析技術的預測模型構建與實證研究[J].現代教育技術,2014,(11):30-38.
[5]Tseng C R, Chu H C, Hwang G J, et al. Development of an adaptive learning system with two sources of personalization information[J]. Computers and Education, 2008,51(2):776-786.
[6]Oughton J M, Reed M W. The effect of hypermedia knowledge and learning style on student-centered concept maps about hypermedia[J]. Journal of Research on Computing in Education, 2000,32(3):366-375.
[7]Wang K H, Wang T H, Wang W L, et al. Learning styles and formative assessment strategy: enhancing student achievement in web-based learning[J]. Journal of Computer Assisted Learning, 2006,22(3):207-217.
[8]Sun K T, Lin Y C, Yu C J. A study on learning effect among different learning styles in a web-based lab of science for elementary school students[J]. Computers &Education, 2008,50(4):1411-1422.
[9]吳青,羅儒國.基于網絡學習行為的學習風格挖掘[J].現代遠距離教育,2014,(1):54-62.
[10]Soller A, Stevens R. Applications of stochastic analyses for collaborative learning and cognitive assessment[J]. Applications of Stochastic Analyses for Collaborative Learning & Cognitive Assessment, 2007.
Empirical Research on E-Learning Behavior based on Association Rules
WU Qing1LUO Ru-guo1WANG Quan-yu2
(1. Educational Scientific Institute, Wuhan University, Wuhan, Hubei, China 430000; 2. School of Continuous Education, China University of Geosciences, Wuhan, Hubei, China 430000)
Large volume of data existed in distance education platform embodies the learners’ personalities and the processes of knowledge building. Because of the limited teacher energy and lacked regulation of learning process etc., this data has not been fully utilized. The E-Learning behavior data in distance education platform is selected from a continuous education school, to find the inherent laws among learning styles, E-Learning behaviors and academic records based on association rules, and converted them to knowledge which benefits to optimize teaching decision and process, thus helping students with different learning styles improve their behaviors, as well as teachers perfect their teaching process according to the learners’ personalities in different teaching types.
E-Learning behavior; learning style; academic record; association rules mining
G40-057
A【論文編號】1009—8097(2015)07—0088—07【DOI】10.3969/j.issn.1009-8097.2015.07.014
編輯:小米
本文為全國教育科學“十二五”規劃2013年度教育部青年課題“基于數據挖掘的網絡學習行為分析及其教學策略研究”(項目編號:ECA130375)、湖北省教育科學“十二五”規劃2013年度課題“基于網絡學習行為的學習風格挖掘及其教學策略研究”(項目編號:2013B004)的階段性研究成果。
吳青,講師,博士,研究方向為教育數據挖掘、學習分析、計算機支持的協作學習等,郵箱為58554930@qq.com。
2015年2月4日