張 薇,李恬恬,虞亞楠,李京忠
(1.許昌學院城市與環境學院,河南 許昌 461000;2.長江大學地球科學學院,湖北 武漢 430100;3.上海農林職業技術學院農業信息工程系,上海 201699)
在線教育資源的方便獲取性以及種類的豐富性,使得網絡學習成為新趨勢,網絡學習也成為當前高等教育中不可缺少的組成部分。
在如今信息技術與網絡高速發展的時代,更多的教育資源以網絡為媒介,為學習者提供更多種類的在線教育。在線教育資源憑借著本身的方便獲取性以及種類的豐富性,使得網絡學習成為新趨勢,同時成為當前高等教育中不可缺少的組成部分。網絡學習者的學習情況會在教育資源平臺上留下記錄,這些數據記錄隱含著學習者大量的學習行為信息,通過對記錄數據的研究與挖掘,能夠探尋學習者的學習行為習慣、內外影響因素,為教學方法的調整和優化提供數據支撐,為教學的進一步完善與發展提供參考依據。
國外的研究較為深入,特別是隨著Coursea,EdX,Udacity 等慕課平臺的出現,產生了大量的教學互動行為數據,這些數據的出現為網絡學習行為的數據發掘與鉆研提供了數據基礎。比如,AIRadaideh Q A 利用決策樹算法,Chanchary F H 等[1]利用關聯規則挖掘,Vaessen 利用離散馬爾科夫模型,Cho 利用社會網絡分析法,對學生成績的影響因素進行分析研究,并對學生最終成績進行了預測。Geigle C 利用隱藏的馬爾科夫鏈,Touya K 利用聚類關聯規則,Yu 利用模糊關聯規則,Talavera 利用最大期望算法,Araya 利用聚類分析法,對網絡學習者的行為模式進行分析研究。
行為特征分析、系統實現和成績預測等方面是國內對網絡學習行為記錄數據挖掘的主要研究方向。在網絡學習行為現狀、特征、影響因素以及對學習效果的影響等方面,李家文[2]、馬志強等[3]、陳丹等[4]、李玉斌等[5]學者做了系統的研究。在構建學習成績挖掘系統、學習特征分析系統、學習行為評估系統、網絡教學視頻優化系統等方面,夏華[6]、屠宏等[7]、范潔[8]、劉文靜[9]等學者做了大量的研究和實踐,為教學方式優化、在線學習指導、教學質量量化管理,提供了系統和算法的支撐。在網絡在線學生成績預測方面,孫力等[10]、武彤等[11]、吳青等[12]、崔東平等[13]、李慶香[14]等學者利用聚類分析、決策樹等數據挖掘算法做了大量的研究,為提高教學質量、優化學生個性化學習環境提供了有效的教學策略。
根據國內外研究現狀可以發現,目前對網絡學習的數據挖掘研究比較豐富,但是研究的成果落實到實際應用的較少,落實到大學生網絡學習的應用也較少,特別是針對高校學生作為研究群體的數據挖掘分析研究鮮有相關文獻。因此,以高校學生群體的網絡學習行為為依托,數據挖掘高校學生群體的網絡學習行為,對高等教育的優化具有重要的意義。挖掘網絡數據的潛在價值,探索與教學信息之間的關聯,從而進一步為學生學習行為糾偏、教學系統完善和教學策略制定提供數據支撐和參考依據,并為高校的轉型發展以及實力的增強提供理論基礎。
中國知網全文數據庫覆蓋面廣,學科類別齊全,是當今最大的中文期刊數據庫,基于中國知網的相關研究具有廣泛的代表性[15]。本研究的數據來源于中國知網全文數據庫,筆者在中國知網全文數據庫中以網絡學習、學習行為、數據挖掘作為主題詞進行檢索,發現相關文獻369 篇,剔除無效文獻84 篇,保留有效文獻285 篇,下面的研究將其作為基礎數據進行相關分析和探索。
文獻計量學是指集數學、統計學和文獻學為一體的定量地分析一切知識載體的交叉科學。其研究方法主要是采用數理統計分析的方法,將計量對象如文獻數 (文獻類型)、作者數 (作者、第一作者單位)、詞匯數以圖表的形式呈現[16]。該研究方法在學科研究熱點分析、研究知識網絡結構解析等方面得到了廣泛的應用,是科學研究必不可少的工具。
基于中國知網全文數據庫,可得網絡學習行為文獻發表時間分布圖,見圖1。由圖1 來看,國內的相關研究最早在2003 年,隨著信息化和網絡教學平臺的發展,這方面的相關研究論文文獻數快速增長,在2016 年達到頂峰,相關研究論文文獻數達到43 篇;2017 年有所減少;2020 年相關研究論文文獻數達到27 篇??傮w來說,隨著信息化技術興起,網絡學習行為的相關研究論文文獻數也在逐漸增多,在2016 年達到頂峰,2017 年以后有所減緩,近兩年隨著大數據分析技術的成熟,對于網絡學習行為的分析挖掘研究又開始逐漸變熱,預計結合大數據的網絡學習行為的相關研究將會迎來新的高峰。

圖1 網絡學習行為文獻發表時間分布圖
了解網絡學習者主要關注的主題分布,對了解現在的主要研究方向可以提供一些借鑒。對該數據進行分析,可得主要主題分布圖 (見圖2)和次要主題分布圖 (見第81 頁圖3)。由圖2 可知,在主要主題中,數據挖掘的文獻數最多,149 篇;網絡學習的文獻數次之,58 篇;網絡學習行為的文獻數位居第三,57 篇。由圖3 可知,在次要主題中,同樣是以數據挖掘為主,其文獻數與主要主題中的文獻數一致,149 篇;學習者的文獻數次之,142 篇;數據挖掘技術的文獻數位居第三,51 篇。在主題檢索中,可以發現網絡學習者對數據挖掘方面的關注度遠高于網絡學習以及網絡學習方法。

圖2 主要主題分布圖

圖3 次要主題分布圖
通過研究文獻來源機構分布,可以了解該領域內的領先區域以及研究機構,為避免重復研究提供便利,同時能夠更加有目的和時效地提升研究層次和研究深度。對檢索結果進行統計可以發現,在文獻來源機構中,發表相關研究論文文獻數最多的是華中師范大學,占比高達11%;吉林大學和東北師范大學次之,占比分別為8%和7%??v觀文獻來源機構分布可以發現,文獻來源機構主要分布在高等院校,其中研究型高等院校與其他普通高等院校差異明顯,文獻來源整體數量上差異較小。
根據文獻的學科分布情況可以發現,相關研究論文文獻數及其占比較大的學科,主要集中分布在計算機軟件與計算機應用、教育理論與教育管理、自動化技術等學科。其中,計算機軟件與計算機應用學科最多,占比為43%;教育理論與教育管理學科次之,占比為26%;自動化技術學科位居第三,占比為12%。其余文獻分布在剩余學科領域,學科比較分散,文獻數也比較少。根據學科分布的占比情況,可以了解學者的關注領域以及現在研究的主流方向。
文獻作者分布可以讓研究人員更好地了解該領域經驗較為豐富的作者與研究機構,為研究人員提供優秀作者以學習和借鑒。陜西師范大學的傅鋼善發表的文獻數最多,有4 篇相關研究論文文獻;東北大學的趙蔚、南通大學的施栓、蘭州工業學院的李興篤,發表的相關研究論文文獻數均為3 篇;其他作者發表的相關研究論文文獻數以2 篇為主。
通過對出版文獻所依托的基金資助研究項目進行統計分析可以發現,受到國家自然科學基金資助的研究文獻數最多,為13 篇;受到國家高技術研究發展計劃資助的研究文獻數為6 篇;受到國家社會科學基金資助的研究文獻數為5 篇;受到浙江省教育廳科研計劃資助的研究文獻數為4 篇;受到全國教育科學規劃課題、湖南省教委科研基金、國家重點基礎研究發展計劃資助的研究文獻數均為3 篇;受到吉林省科技發展計劃項目、山西省自然科學基金、安徽省自然科學基金資助的研究文獻數均為2 篇。綜合分析可以發現,資助研究項目的基金以國家級基金和省級教育基金為主,其他類別基金對該領域的資助處于萌芽階段,還沒出現系統性的發展。為了更好地研究與發展網絡學習,需要國家級資金和地方資金與高等院校相結合,基金加大資金支持與資助力度,院校加強研究水平。
本研究以中國知網全文數據庫為依托,檢索網絡學習、學習行為、數據挖掘等主題詞,利用文獻計量法進行整理與分析,得到如下結論。
1)網絡學習行為相關研究呈小幅度波動,且有階段性特點。隨著網絡學習的日益發展,在時間分布上可以明顯地發現時間分布具有階段性特點,整體呈現波動變化。由于整體發表文獻數較少,因此從2003 年到現在整體變化不大。從整個研究過程來看,相關研究論文文獻數出現小幅度波動,呈現一定的向好趨勢,但還需要廣泛關注。
2)網絡學習行為相關研究學科廣泛,研究單位以高等院校為主。綜合分析數據挖掘下的網絡學習,發現涉及的學科種類豐富,其中計算機軟件與計算機應用、教育理論與教育管理、自動化技術的文獻數及其占比最大,其他學科文獻數較少。文獻來源機構分布、作者分布,主要集中在高等院校,不同高等院校之間的文獻數具有一定差異性。
3)網絡學習行為相關研究的資金支持以國家級資金為主,省級資金支持差異較大。對網絡學習的基金資助研究項目進行統計分析可以發現,資金主要來源于國家級資金支持,其次來源于省級資金支持。省級資金和其他地方資金對網絡學習的支持情況各不相同,存在著明顯差異。結合機構分布情況可以表明:網絡學習研究較為廣泛的機構與省級資金支持有一定關聯性。