譚 陽,陳 琳,劉 艷,寧 可
(湖南網絡工程職業學院 信息工程系,湖南 長沙410004)
基于在線數據過濾提取的高職學生網上學習行為調查與分析*
譚陽,陳琳,劉艷,寧可
(湖南網絡工程職業學院 信息工程系,湖南 長沙410004)
網絡化教學是高等職業教育發展的必然趨勢,要提升網絡化教育的質量,掌握學習者在網絡中的學習行為是基本的切入點。本文通過構建基本網絡學習行為提取模型,以在線監控的方式收集學習者在網絡學習過程中的行為數據;并以協同分類的算法過濾網頁頁面內容,以提取高職學生網絡學習行為的特征數據。在此基礎上,本文還研究了所獲得的網絡學習行為數據,分析了學習行為產生的原因,給出了針對性的建議。
在線數據;過濾算法;網絡學習行為;高等職業教育
隨著我國網絡及在線教育的迅速發展,計算機網絡已成為我國高等職業教育過程中重要的教學工具、認知工具以及學習環境。隨著高職師生對計算機網絡使用率的不斷提升,網絡化教學已經成為職業教育重要的發展方向,通過購買或定制方式來將現有的職業教學資源網絡化,成為很多高職院校完善自身的網絡教學平臺和資源內容的重要手段。[1]然而,隨著網絡學習資源的不斷豐富、網上學習條件的不斷完善,高職學生的網絡學習成效卻沒有隨之得到相應的提升。如何構建高質量的、更具針對性的、符合高職教育特點的網絡教育體系,一直為高職教育工作研究者所重視。[2-3]
掌握學習者的網絡學習行為是教育者做好網上教學的出發點和切入點。由于高職院校學生的學習特點和心理特征具有特性化的一面,如基礎知識比較薄弱,學習的積極性和主動性較差,比較喜歡操作型、技能型的知識等。[4]針對高職學生自身的特性來構建其網絡學習行為的模型,并以該特性模型來對高職學生在線行為數據進行過濾,以提取能夠反映高職學生網絡學習行為特征和網絡學習能力的數據。以此為基礎,為研究高職學生網絡學習的效果和改進網上職業教育教學方法提供參考數據。為此,本文以湖南網絡工程職業學院信息工程系兩屆學生的實際網絡數據為例,進行詳細的調查與分析。
(一)網絡學習的概念
當前,國內外對網絡學習行為概念的基本描述為:學習者利用計算機或其他信息工具,通過網絡來主動運用和調控自我的認知、動機和行為所進行的學習活動,強調學習者的“自我導向、自我激勵和自我監控”。[5]網絡學習行為作為全新學習理念,較傳統學習行為表現出了不同的特征,主要表現在以下四個方面:[6]
1.發生學習行為的環境具有開放性。網絡學習行為,通常是借助數據傳輸技術來對各種遠距離教育資源進行認知的行為;它強調教育資源和教學對象具有時空分離的特性,因而具有較強的開放性。
2.網絡學習行為控制的自主性。網絡學習行為允許學習者自主確定學習目標、制訂學習計劃、選擇學習方法,從而實現網絡學習行為控制的自主化。
3.網絡學習行為交互的充分性。網絡環境下的學習行為表現出更加充分的交互性,有利于學習者表達自己的思想情感和觀點,克服對教師和學伴的畏懼及羞澀心理。
4.網絡學習行為技能的專業性。網絡學習行為技能表現出一定的專業性特征,學習者不但要掌握學科相關的專業知識,還要對以網絡數字媒介為主的信息技術有較好的掌握。
(二)網絡學習行為的研究
與傳統的課堂教學相比,網絡教學過程更為強調程序化,以保證網絡教學過程的質量。但是程序化的網絡教學資源必須要學生成為網絡學習行為的實施主體才能轉化為頭腦中的知識。[7]因此,研究網絡教學質量,必須從研究學生的學習行為入手,當前國內外有關網絡學習行為的研究主要集中在以下三個方面:[8]
1.通過問卷、訪談等形式調查學習者的網絡學習行為現狀和水平,總結影響學習者在網絡學習效果的行為因素,探討提高學習者學習質量的對策。
2.網絡學習行為監控研究,試圖通過學習者以往學習行為的分析,通過技術途徑為學習者學習提供適當的指導和監控措施。
3.基于網絡學習行為信息挖掘及智能化教學平臺研究,嘗試為不同學習行為的學習者提供多種在線學習方案和學習指導。
本文嘗試結合三個研究方向的特點:首先,通過構建自動化數據收集平臺來對學生的網絡學習行為進行監控和樣本的收集;其次,采用數據提取方法來對初始數據進行清理和分類,并對符合條件的數據以ItemCF算法[9]的興趣度進行量化,得出相關的參考數據;最后,對特定數據及其對應的網絡行為,以對學生進行回訪的形式來獲知其產生的原因。
(一)網絡學習行為模型的構建
根據網絡學習行為程序化的特點,分析模型主要針對以下三個方面的行為內容進行構建:一是導向型的學習行為,指教師通過引導學生點擊網絡資源的學習行為。二是交互型的學習行為,主要是指具備師生互動過程的網絡學習行為。三是拓展型學習行為,是指學生利用搜索引擎等網絡工具來主動對課程相關內容進行拓展性認知。為了能夠有效地對所有收集到的網絡學習行為進行區分和歸納,本文將網絡學習行為進一步具體化為9種不同的行為子類型,分別為導向型(課程導學、教學輔導、考前輔導、網上考核)、交互型(課后作業、答疑、FAQ、BBS)、拓展型(使用搜索引擎)。如圖1所示。

圖1 三類典型的網絡化學習行為模型
(二)在線數據的來源及構成
本文用于分析的原始數據來源于對湖南網絡工程職業學院信息工程系學生2013級 (202人)、2014級(396人)計算機應用技術、計算機網絡技術、軟件技術三個專業學生所采集的在線數據。樣本的選取基于以下兩點考慮:第一,信息類專業的學生計算機(信息終端)的普及率遠高于其他專業,樣本分布廣泛度高且均勻度較好;第二,信息類專業的學生自身的信息化操作水平較高,無需教師更多的介入,能夠較好地保障數據的天然性。[10]
數據采集的課程為三個專業方向均開設的 《計算機應用基礎》、《計算機專業英語》、《綜合布線技術》及《IT企業文化》。選取這4門課程的原因是:《計算機應用基礎》為公共基礎課程,同時信息工程系的學生對于這門課程的基礎知識掌握得相對較好;《計算機專業英語》是一門結合傳統教學資源的專業基礎課;《綜合布線技術》為專業核心課程,同時也是強調技能操作過程化考核的課程;《IT企業文化》是一門院級專業通識課程。這4門課程的覆蓋面較廣,同時自身特性的重疊度較低,具有較好的代表性。
數據采集的時間段為2013年9月至2015年7月,為期4個學期。為了保證采集的在線數據的樣本具備自發性和多樣性,將上述4門課程的考核方式由傳統的“平時成績+作業成績(紙質提交)+終結性考核”的方式,調整為“平時成績+作業成績(網絡提交)+點播課程資源+課程網絡交互(BBS網絡答疑)+終結性考核”的方式。并人為地減少終結性考核的比重,增加網上學習過程考核部分,同時提高過程考核的系數,以促進學生的學習行為由線下轉移到線上。
(三)在線數據的過濾提取方法
ItemCF算法是目前工業界應用最廣泛的分類協同過濾算法之一,它通過基于鄰域的方法來對用戶行為數據庫進行相似度計算,采用近鄰算法來構建用戶的歷史行為,并以此來分析用戶對某些行為的偏好程度。因此,本文以ItemCF算法為基礎提出一種用戶網絡行為的協同過濾算法,其主要分為兩個步驟:首先計算網頁頁面內容之間的相似度;然后根據用戶歷史行為和頁面內容的相似度計算出用戶的模式(興趣)列表。
為了能夠度量網頁內容之間的相識度,本文用余弦相似度定義頁面i與頁面j的相識度,如式(1)所示:

若網上學習系統中有m個網頁頁面,則用式(2)計算用戶u對網頁頁面i的興趣程度,其中ruj表示用戶u對頁面內容j的興趣。

本文對ItemCF算法應用于網絡學習行為模式提取的執行過程如下:
第一步:對每個觀測學生以IP+MAC地址為賬戶,建立網絡學習行為數據庫,并記錄由服務器獲取的學生感興趣的網頁頁面列表。
第二步:獲取每個賬戶的個人共現矩陣,并將所有賬戶的個人共現矩陣相加,得到系統的網頁頁面共現矩陣Cm×m。其中,Ci,j被稱為協同因子。
第三步:對共現矩陣中每一個不為0的元素計算頁面的余弦相似度,得到網頁頁面之間的余弦相似度矩陣Wm×m。
第四步:從賬戶的行為記錄中獲取每個學生對網頁頁面的偏好矩陣R。
第五步:將頁面相似度矩陣與偏好矩陣相乘,即可獲得模式(興趣)矩陣 P,如式(3)所示,其中Pi,j表示用戶j對網頁頁面i的興趣值。

第六步:對矩陣P的每一列進行排序,并剔除一些特定頁面,例如成績查詢頁面、賬戶登錄頁面等,即可得到每個學生最為感興趣的頁面內容的排序,對每個賬戶興趣度排名前十的頁面以表1中的高斯分布加權值進行統計,通過排序即獲得該群體的網絡學習行為的模式(興趣)列表。
數據服務器通過對學生所訪問的頁面內容進行數據采集,并對采集到的數據以ItemCF算法進行過濾分析。通過數據整理,共獲取2013級、2014級學生590個有效的活躍賬戶(能夠進行有效分類頁面采集,且次數在10次以上的賬戶),占總人數的98.76%。共抓取有效樣本(頁面)247613個。通過ItemCF算法篩選其中包含4門統計課程內容的頁面,并按照每個賬戶的興趣度計算權值。過濾后所得到的頁面,以8種不同的統計類別按年級分別計算。其中,“興趣總權值”為對有效賬戶興趣排名加權值的求和,這個數據主要體現參與某項網上學習行為的學生對于頁面內容的頻繁(喜好)程度,其數值越高代表其頻繁度越大。“參與比”為參與有效興趣權值(大于0)計算的賬戶與學生總人數的比值,這個數據具體表現為學生對某項網絡學習行為參與程度的高低,反映學生對某種網絡學習類型接受的廣泛性。為了盡量體現學生對網絡學習行為的自發性和天然性,對屬于強制性必然行為的“網上考核”進行了剔除,沒有將其納入學習行為的統計之中。經過數據整理,2013級、2014級學生對不同課程的學習行為統計如表2所示。

表1 個人賬戶興趣排名前十所對應的加權值

表2 兩個年級學生群體對于不同課程網絡學習行為的統計
(一)對主導型學習行為的分析
通過分析表2中的數據,在“導學資料”、“教學輔導”、“考前輔導”這三類教師行為影響較大的主導型學習行為項目中,平均參與比例為35.3%,平均興趣權值為0.632,這也表明教師對教師主導型的網絡學習行為活動的產生,仍然具備較強的影響力和控制力。其中,整體教學手段較為傳統的《計算機專業英語》和《綜合布線技術》的學生參與度要高于其他兩門整體教學手段更網絡化的課程。其中,《計算機專業英語》的“考前輔導”平均參與比例高達61.8%,遠高于其他三門課程的參與比例,這是因為該門課程終結性考核 (閉卷筆試)的比例較大,學生更寄希望于通過考前輔導來獲取更好的成績。而在另一方面,強調技能操作考核的《綜合布線技術》課程的平均參與比例僅為22.7%;這一差異體現了課程主體考核方式的不同對學生網絡學習行為產生不同的影響。
(二)對交互型學習行為的分析
在交互型的4類網絡學習行為方面,學生參與程度最高的為“網上作業”,其平均參與度為39.8%,平均興趣權值為0.714,這體現了較高的參與度和認同度;其中《計算機專業英語》和《IT企業文化》兩門課程教師分別對2013級和2014級學生做出了不同的要求,教師提高了“網上作業”在課程總體考核中的比例,這直接導致了學生參與程度平均提高了21個百分點。通過這一變化,也可以確定教師通過間接的手段,同樣能夠對學生的網絡學習行為施加較大的影響。
在學生完全自主的相互交流的平臺“BBS”中,整體教學手段更為網絡化的《計算機應用基礎》和《IT企業文化》的學生參與比例則高出教學手段較為傳統的課程20%以上。可見對于教學手段網絡程度較高的課程,學生之間相互以網絡平臺進行交流的程度也有所提高。同時,值得我們注意的是《IT企業文化》是一門通識課程,而《計算機應用基礎》對于信息類專業的學生來說其通識化程度也較高。這也說明相對于專業程度要求更高的課程,通識課程對學生的專業基礎要求較低,也更容易引發以群體討論為主體的網絡學習行為。這一點在《IT企業文化》這門課程上體現得尤為明顯,兩個年級的平均參與度超過60%,平均興趣權值超過0.851,這是一個非常顯著的數值,意味著在參與《IT企業文化》課程學習的學生中不少于25%的學生將BBS討論作為該門課程興趣度最高的網絡學習行為。
就交互型的四類學習行為的總體情況而言,其平均參與比例為21.2%,其中 “FAQ”的平均參與比例僅為8.1%,平均興趣權值為0.373。通過后續的問卷調查得知,學生在遇到問題的時候通常第一選擇是問其他同學,特別是當時在附近的同學;其次是通過網絡搜索工具來獲取問題的答案。這反映出學生在進行網絡學習活動時,遇到問題會自然地以就近原則選擇回復速度最快的方式;而通過網絡教學平臺以留言給教師的方式來解決問題,則因為時效性的問題難以成為學生的首要選擇。因此,網絡教學活動中時空的分離,反而成為了阻礙師生間進行交互型教學活動的因素之一。
(三)對拓展型學習行為的分析(見表3)
在搜索引擎的使用上,《計算機應用基礎》和《IT企業文化》兩門課程的平均參與比例分別為65.1%和78.8%,平均興趣權值分別為0.855和0.862。這也表明在這兩門課程中使用搜索引擎的成為了學生主要的網絡學習行為之一。其中值得注意的地方是,在這4門課程中BBS與搜索引擎的參與程度表現出兩者呈正向關系。為此,我們通過事后對學生訪談得知,在活躍度較高的BBS中提出開放性問題,相對容易引起學生參與對該問題的討論,在進行網絡討論的過程中參與者會自發地、大量地使用網絡搜索,從而提升了針對討論內容的網絡搜索行為。

表3 4門課程中網絡學習行為的統計
就總體情況而言,低年級(2014級)較高年級(2013級)在所有課程的參與度上都有所提高,平均興趣權值除《計算機應用基礎》之外都有所提升,這表明高職學生對于網絡學習行為總的認可程度是朝著正向發展的。同時,我們也應該看到,對于工科類高職學生而言,對技術類課程還是傾向于以操作教學和實踐教學為主要手段的傳統教學模式。學生對網絡資源的獲取也較多地集中在教師行為介入較深的導學資料和教學輔導上。對于更為強調自主的BBS和搜索引擎的使用則相對較少。而《計算機專業英語》這門課程,學生在網上的學習過程主要集中在“考前輔導”上,通過觀察該門課程的各項網上學習行為數據,學生總體的參與比例都較低,通過事后走訪,得知學生的英語基礎普遍不高,對于用英文編寫教學資料和課后輔導資料在閱讀上存在客觀上的困難;因此造成該課程的網上參與程度相對較低。而對于《計算機應用基礎》和《IT企業文化》這樣的基礎通識課程,學生則明顯地更加傾向借助網絡來完成課程的學習,特別是當前在國家層面提出“互聯網+”戰略的情況下,學生通過搜索引擎和網上互相討論的方式可以更快、更好地獲取相關知識。
為了能更好地促進高職網絡教學模式的改革,制定符合高職學生特性的網絡教學手段,在前文數據分析的基礎上對網絡學習資源建設和網絡學習行為引導提出幾點建議,以供參考。
(一)進一步加強教師在網絡學習行為中的引導作用
進入網絡學習時代,教師在學生的網絡學習過程中仍然是十分重要的角色。在教師為主導的網絡學習活動中,進一步加強對網絡教學資源的優化,使教學資源更加符合高職網絡教學的要求;由于高職學生在知識基礎、認知程度等方面存在薄弱環節,網絡學習資源的類型和內容需要充分考慮不同類型學生的特性,做到“因特性施教”。在交互型學習活動中,教師應明確學生課程學習的目標和任務,教學活動的設計盡量以傳統與在線相結合、特性化與合作化相結合的方式進行。特別是對于學生在線提出的問題要及時地予以反饋。
(二)提高學生網絡學習的意識和自主性
學習過程網絡化是今后高職教育發展的必然趨勢。讓學生從思想上可以真正接受網絡化的學習模式,并且習慣于這種學習模式,教師和學校仍需加強培養學生網上學習的能力和網上學習的意識。同時,鼓勵學生群體通過社交軟件(微信、QQ、微博)來建立小型的交流、討論群,這樣不但可以擴展學生的交流范圍,也可以增加學生對網絡交互的認同感,利于網絡教學的推廣和普及。
(三)注重課程自身的特點,建立符合課程教學規律的教學資源
課程教學的網絡化并不是簡單地將教學資源上傳至網端。對于實操型和技能型的課程,課堂教學和實訓教學的作用目前來說還是無可替代的;這一點在工科為主體的技術型職業院校中尤其值得注意。有針對性地組織課程中網絡教學的內容,通過對線上教學資源和線下實訓、實習過程有機的組合,才能夠促進高職學生通過網絡將原有的知識與將要學習的內容建立橫向和縱向的聯系,有利于學生對知識進行解構,提高綜合學習效率。
(四)建立多元化的網絡學習評價體系
從技術層面來說,現有的網絡學習平臺已經可以為學生的學習過程提供多種方式的評價,從而避免單一評價方式的片面性。對于高職學生網絡學習的評價,應重點落在對學生的行為評價和過程評價上,以學習主體的行為產生來評價學習行為;以可量化的行為參數來評價學習過程。網絡化的學習行為容易受到學習環境、認知能力、自我控制能力等多種因素的影響,所以評價結果要做到多元、客觀,才能夠真正反映高職學生的網絡學習行為和認知遷移能力。
[1]曾美英,于紅軍,李愛國,侯伯明.高職生自主學習能力與網絡依賴程度關系的研究 [J].心理科學,2008(1):105-108.
[2]姜強,趙蔚,王朋嬌.基于網絡學習行為模式挖掘的用戶學習風格模型建構研究[J].電化教育研究,2012(11):55-61.
[3]AnthonyG.Picciano.TheEvolutionofBigData andLearningAnalyticsinAmericanHigherEducation[J]. JournalofAsynchronousLearningNetworks,2012,16(3):9-20.
[4]姚潔.大學生在線課程學習準備狀態實證研究[J].中國遠程教育,2015(11):25-29.
[5]姜強,趙蔚,王朋嬌.自適應學習系統中雙向適應交互評價實證研究[J].現代遠程教育研究,2013(5):106-112.
[6]王艷娟.理工類院校歷史文化通識課程的網絡教學研究[J].中國教育信息化,2015(18):44-46.
[7]周平,張莉.在線教學自主評價系統的構建與應用研究[J].中國教育信息化,2015(17):86-89.
[8]孫瑩,程華,萬浩.基于數據挖掘的遠程學習者網上學習行為研究[J].中國遠程教育,2008(5):44-47.
[9]應毅,劉亞軍,陳誠.基于云計算技術的個性化推薦系統[J].計算機工程與應用,2015(13):111-117.
[10]PiccianoAG.Theevolutionofbigdataand learninganalyticsinAmericanhighereducation[J].Journal ofAsynchronousLearningNetworks,2012,16(4):9-20.
(編輯:王天鵬)
G434
A
1673-8454(2016)11-0026-05
*本文系湖南省教育廳高校科研青年項目 “基于職教新干線空間平臺的課程交互式習題庫和智能評價系統的研究”(項目編號:ZJC2013039)、湖南省高校科研項目“基于動態核融合的巨型頻繁模式挖掘算法的研究”(項目編號:15C0928)、湖南廣播電視大學重點課題“基于大數據的高職學生網上學習行為模式的挖掘”(項目編號:XDK2014-A-1)研究成果。