999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學習分析技術:挖掘大數據時代下教育數據的價值

2013-04-29 00:44:03魏順平
現代教育技術 2013年2期

魏順平

【摘要】當前,大數據時代已經來臨,教育領域同樣積累了海量數據。教育領域已經部署了眾多的學習管理系統,在這些軟件系統中存儲著海量的學習者信息及學習過程數據。如何利用這些數據,使這些數據轉變為信息、知識,并為教學決策、學習優化服務,已成為教育工作者以及學習者們所關注的內容。學習分析技術有助于發揮學習過程數據的價值,使數據成為審慎決策、過程優化的重要依據。該文介紹了國內外學習分析技術研究現狀,歸納出學習分析技術的關鍵技術及分析模式,并以實例從不同用戶視角包括管理者、輔導教師、學習者展示了學習分析技術在網絡學習過程分析中的應用過程。

【關鍵詞】大數據時代;教育數據;學習分析;關鍵技術;分析模式

【中圖分類號】G40-057

【文獻標識碼】A

【論文編號】1009-8097(2013)02-0005-07

剛剛過去的2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”在教育領域,《2013NMC地平線報告(高教版)》(預覽版)非常有預見性的認為“大數據和學習分析”將在未來2至3年成為主流技術。

一 核心概念界定

在首屆“學習分析和知識國際會議”上,與會者一致認為:學習分析技術是測量、收集、分析和報告有關學生及其學習環境的數據,用以理解和優化學習及其產生的環境的技術。《2012NMC地平線報告(高教版)》也給出了近似的定義,即學習分析技術是對學生生成的海量數據的解釋和分析,以評估學生的學術進展,預測未來的表現,并發現潛在的問題。從這些定義可以看出,學習分析技術分析的對象是學生及其學習環境,目的是評估學生、發現潛在問題、理解和優化學習,基礎是海量數據。

二 國內外研究現狀

2011年2月底,首屆“學習分析技術與知識國際會議”在加拿大的阿爾伯達省班芙市舉行,主題之一就是學習分析技術。美國新媒體聯盟發布的2010年度和2011年度《地平線報告》均預測學習分析技術將在未來的四到五年內成為主流。可見,學習分析技術已逐漸成為教育中的一項新興技術。

事實上,在“學習分析技術”概念出現之前,與之相關的技術、工具及其應用研究已經開展起來。2004年在高等教育中出現的“智能導師系統”和“人工智能系統”掀起了“教育數據挖掘”研究的熱潮,也促使學術分析技術這一關注學習者行為的分析技術的誕生。Romero&Ventura(2007)以及Baker&Yacef(2009)對10余年的教育數據挖掘研究進行分析,歸納出5類教育數據挖掘方法,它們是統計分析與可視化;聚類(聚類、離群點分析);預測(決策樹、回歸分析、時序分析);關系挖掘(關聯規則挖掘、序列模式挖掘、相關挖掘);文本挖掘。另外,隨著網絡學習及相關學習管理系統的不斷普及,數據挖掘方法在學習管理系統中得到應用,并開啟了利用網絡分析技術對學習者行為加以分析的研究,Romero,C.等人(2005)對Moodle學習平臺的日志分析是這方面研究的典范。記錄在學習管理系統中的學習者行為數據,經過聚集、分類、可視化以及關聯規則分析等操作,生成實時的數據報告,或者利用從行為數據中反映出的常模來生成預測模型。隨著學習分析研究與實踐的不斷深入,除了數據挖掘方法外,一些原本屬于社會科學領域的方法如社會網絡分析法、話語分析法、內容分析法等也得到成功應用并成為學習分析的關鍵技術,這些方法的典型應用之一是師生交互行為分析。

國內外多位研究者的研究實踐證明,學習分析技術對于學生、教師、管理人員、研究人員以及技術開發人員均具有重要價值:(1)對于學生而言,學習分析技術可以從學習者行為角度了解學習過程的發生機制,并用來優化學習,以基于學習行為數據的分析為學習者推薦學習軌跡,開展適應性學習、自我導向學習。(2)對于教師和管理人員而言,學習分析技術可用來評估課程和機構,以改善現有的學校考核方式,并提供更為深入的教學分析,以便教師在數據分析基礎上為學生提供更有針對性的教學干預。(3)對于研究人員而言,學習分析技術可作為研究學生個性化學習的工具和研究網絡學習過程和效用的工具。(4)對于技術開發人員而言,借助學習分析技術發現的學習管理系統各模塊使用頻次以及使用路徑,優化學習管理系統界面設計,并且根據其他人員開展學習分析的需要優化學習管理系統日志功能。

另外,學習分析技術在網絡高等教育領域大有可為,有助于監控學習過程,保障教育質量。學習分析的開展有賴于系統化、結構化的海量數據,恰好網絡高等教育由于其全面采用學習管理系統和教育管理信息系統,已經積累了大量的系統化、結構化數據。自1998年教育部開展現代遠程教育試點工作以來,我國網絡高等教育得到了迅猛發展。據教育部統計數據,2010年網絡高等教育本、專科招生數達166萬人,在校生數達453萬人,分別占當年全國高等教育招生數和在校生數的16%和14%,由此可見網絡高等教育在我國高等教育中的重要地位。近年來出現的網絡高等教育學生考試集體作弊事件讓社會對網絡高等教育質量提出質疑,因此,著力提高網絡高等教育的質量應該放在更為突出的位置。應用學習分析技術,調查網絡高等教育中學習者網絡學習的現狀,包括學習者的主要特征、網絡學習行為特點、學習行為的影響因素及其所帶來的學業結果,有助于掌握成人網絡學習規律,從而優化學習過程,改進學習效果,提升教育質量。

三 關鍵技術與分析模式

1 學習分析關鍵技術與主要工具

學習分析關鍵技術涉及內容分析、話語分析、社會網絡分析、系統建模等技術以及統計分析與可視化、聚類、預測、關系挖掘、文本挖掘等一系列數據挖掘方法。

常見的學習分析工具有很多,如支持對原始帖子進行標注或編碼、交叉引用和簡短評論的工具包括Nvivo、Atlasti;支持基本的基于詞典的文本分析的工具,如CATPAC、LIWC;專門的內容分析工具,如北京師范大學知識工程研究中心開發的智能化內容分析工具VINCA;專門的社會網絡分析工具,如UCINET;用于系統建模的工具,如Coordinator系統建模工具;專門的數據挖掘工具,如SQL SERVER 2005 Analysis Service(SSAS)、Weka、SPSS等等。

2 學習分析技術應用情境分析與學習分析模式構建

學習分析的對象自然是學生的學習。通過對學習過程各要素的分析,我們可以進一步細化學習分析的對象,從而界定出各種應用情境,并構建特定的應用模式。我們采用格語法中的格框架方法,以“學習”為中心謂詞進行語義格標識。常見的語義格包括施事格、工具格、承受格、使成格、處所格、客體格等。所得結果如圖1所示。

如圖1所示,采用學習分析技術對“學習”的語義格包括“學習者”、“學習內容”、“學習方式”、“學習結果”等進行挖掘分析,將使格框架中的中心謂詞“學習”的細節更加清晰,從而形成對學習現狀的更加完整的認識,能夠回答“誰在學、學什么、怎么學、學的結果如何”等一系列問題。針對解決不同類型的問題,將產生三類學習分析技術應用情境,即用于回答“誰在學”的學習者特征分析,用于回答“學什么、怎么學”的學習過程分析以及用于回答“學的結果如何”的學習結果分析,從而構建出三種學習分析模式,可為他人完成類似的挖掘任務提供參考。

學習分析模式由“學習分析流程”、“工具與算法”及“數據與信息”三要素構成。“學習分析流程”包括數據收集、數據預處理、分析、預測、應用等環節,根據應用情境的不同“學習分析流程”各環節有所區別;“工具與算法”為“學習分析流程”提供支撐,它們從“學習分析關鍵技術與主要工具”中選取;“數據與信息”既有向“工具與算法”輸入的數據,又有從“工具與算法”輸出的信息或知識。

一種用于學習過程分析任務情境的學習分析模式如圖2所示。

在數據挖掘工作流的核心環節,主要的數據挖掘任務有學生登錄行為分析、學生資源瀏覽模式分析、師生交互論壇分析和學生行為影響因素分析,所用到的工具和算法則有SSAS的聚類分析與順序分析、聚類分析、關聯規則等以及UCINET的網絡圖繪制等。

四 基于用戶視角的學習分析技術應用

前文已經提到,學習分析技術對于網絡學習有獨特價值。由于筆者所在單位是68所現代遠程教育試點院校之一——中央廣播電視大學,可以較為方便的獲取該校的學生數據,并且該校的辦學規模在整個網絡高等教育中具有獨特地位,其招生數和在校生數都遠高于其他遠程教育試點。自2004年以來,中央廣播電視大學所舉辦的網絡高等教育(一般稱作“中央電大開放教育”,后文在談及中央電大網絡高等教育時將采用這一稱法)始終占有全國網絡高等教育60%~70%的份額。本文將選取中央廣播電視大學的學習管理系統,采用各類學習分析工具,基于學習管理系統的日志數據以及教育管理信息系統有關學籍、課程、教師的數據,從管理者、輔導教師以及學習者等多種用戶視角深入分析成人學習者網絡學習現狀及其影響因素,以優化成人學習者學習過程。

1 管理者視角的學習分析技術應用

作為教學管理者,他們一般采用學習分析技術了解某個辦學機構的整體教學情況,如師生數量、學生各類活動總量及平均情況、教師各類活動總量及平均情況,主要用到“統計分析與可視化”這一類方法。

為了有效監控地方電大網上教學情況,對地方電大網上教學工作進行有針對性的指導和幫助,中央廣播電視大學每年要組織對地方電大日常網上教學進行跟蹤檢查。常見的檢查內容如表1所示(該表由成都廣播電視大學改造完成)。

下面對表1中的一些重要指標進行說明。

通過“上網學生數”、“上網學生數/在校生數”兩項指標反映辦學單位組織、引導、督促學生上網學習的情況。這兩項指標是對辦學單位組織、引導、督促學生網上學習情況進行后續分析的前提。

通過“學生登錄次數”、“學生登錄次數/上網學生數”兩項指標反映學生網上學習活動的頻度。進一步對學生登錄的時間段分析,可以反映學生網上學習的進度和網上學習是否均衡。“新登錄學生數/總登錄學生”以當月登錄學生數和登錄次數分別占全年登錄學生數和登錄次數的比例,說明學生網上學習的持久性和穩定性。

通過“學生在線時間長度”反映說明學生參加網上學習的深度。

通過“瀏覽資源次數”、“生均瀏覽資源次數”、“論壇發帖總數”、“生均發帖數”等指標反映學生在網上點擊資源和發帖交流的情況。該指標是評估辦學單位組織和實施網上學習的重要指標。

2 輔導教師視角的學習分析技術應用

對于輔導教師而言,一般以所負責的某門課程為單位開展教學分析,分析內容包括學習者網絡學習表現統計描述(從學習時間投入、學習活動頻度、學習資源瀏覽、考試成績等多個方面)、學習者自主學習路徑分析、師生交互行為分析、影響成人學習者網絡學習表現的各種因素分析,等等。所用的學習分析技術可以很豐富,如師生發帖的內容分析、師生交互的社會網絡分析以及統計分析與可視化、聚類、關聯規則、序列模式挖掘等一系列數據挖掘方法。

作者選取中央廣播電視大學開放教育學生的入學課程《開放教育學習指南》課程作為樣本來說明輔導教師視角的學習分析技術應用特點。

《開放教育學習指南》是中央廣播電視大學開放教育專科和專科起點本科各專業學生的必修課,是開放教育學生的入門課程。以《開放教育學習指南》網絡課程的在線學習過程數據作為研究樣本,這些數據包括學生在使用電大在線學習平臺時產生的登錄、資源瀏覽、學習體驗等數據以及學生存使用形成性考試平臺時產生的考試成績數據。為了開展影響因素分析,作者還從中央電大教務管理平臺中采集學生基本信息數據。最終,作者獲得了來自江蘇電大參加2010年春季《開放教育學習指南》網絡課程試點的9369名學生的基本信息數據、登錄數據、資源瀏覽數據和形成性考試數據等四份數據。作者即以這9369名學生對應的基本信息、登錄、資源瀏覽和考試成績等四類數據作為分析對象,應用學習分析技術了解該課程中課程模塊瀏覽情況以及學生自主學習路徑。

(1)課程模塊瀏覽情況分析

《開放教育學習指南》網絡課程包含“課程各章節”、“體驗區”、“視頻資源庫”、“問題庫”、“資料庫”和“常用工具庫”等內容模塊。如表2所示,是網絡課程各模塊的一個說明。

如表3所示,是《開放教育學習指南》網絡課程各模塊的瀏覽情況。

各個統計項說明如下:

①被瀏覽的資源頁面個數:通過頁面瀏覽日志數據統計得到的各模塊頁面個數,可能少于各模塊實際包含的頁面數。

②瀏覽頻次:即一個頁面被點擊打開的次數。

③單個頁面瀏覽頻次均值:由“瀏覽頻次/被瀏覽的資源頁面個數”算式得來。主要用來反映該模塊各資源頁面的使用程度。

④瀏覽學生數:通過頁面瀏覽日志數據統計得到的瀏覽各模塊的學生數。

⑤學生參與率:由“瀏覽學生數/學生總數”算式得來。用來反映該模塊被學生關注的程度。

⑥人均瀏覽頻次:由“瀏覽頻次/瀏覽學生數”算式得來。用來反映各學生在該模塊的學習程度。

⑦單個資源人均瀏覽頻次:由“人均瀏覽頻次/被瀏覽的資源頁面個數”算式得來。用來反映各學生在該模塊各資源頁面的學習程度。

如表3所示,從模塊的被使用程度和被學生關注的程度來看(觀察“瀏覽頻次”列和“學生參與率”列),由高到低依次是課程各章節、體驗區、視頻資源庫、問題庫、資料庫、常用工具庫,這恰好是這些模塊在課程首頁由上而下呈現的順序。說明模塊在首頁的布局反映了學生的學習習慣,也可能是這種布局對于模塊的被使用程度產生了影響。對于網絡課程界面設計的意義則在于,要想使某個模塊得到學生關注,應該將其置于首頁的顯著位置。

如表3所示,從各學生對不同模塊各個資源頁面的學習程度來看(觀察“單個資源人均瀏覽頻次”),由高到低依次是體驗區、問題庫、課程各章節、視頻資源庫、常用工具庫、資料庫。學生對體驗區、課程各章節各資源頁面的學習程度高說明作業的設置產生了明顯的導向作用。相比之下,體驗區的學習程度更高一些,每個學生對體驗區的每個頁面的瀏覽次數平均為2.54次,而課程各章節的單個資源生均瀏覽頻次則在1次以下。產生這一差異的原因可能是:體驗區采用一種模擬環境,以互動的方式讓學生掌握網上學習技能,更能引發學生的學習興趣,吸引學生反復學習。對于其他四個非作業要求的模塊來說,學生對問題庫的學習程度要顯著高于其他三個模塊,說明學生有較強的通過常見問題庫來解答初入學的各種疑問的需求。今后應該進一步豐富問題庫,并將問題庫的檢索框置于首頁的顯著位置,以便及時、方便地解答學生的各種疑惑,幫助學生盡快進入開放教育之門。

(2)自主學習路徑分析

通過“課程模塊瀏覽情況分析”,可以幫助輔導教師了解學生學習過程的靜態信息,而進一步開展“自主學習路徑分析”,則可以幫助輔導教師進一步了解學生學習過程的動態信息。

這里采用Microsoft順序分析和聚類分析算法,從模塊訪問跳轉的角度分析學生的學習路徑。數據來源則是用戶每天瀏覽課程頁面產生的過程數據,如表4所示。

在構建挖掘模型時,以“瀏覽日期+學號”作為鍵值,以“瀏覽順序號”作為序列鍵值,以“瀏覽模塊”作為預測值來構建挖掘結構,并應用Microsoft順序分析和聚類分析算法,得到如表5和圖3所示結果。

表5是各模塊直接的轉換概率。在概率的計算方法上,以值“課程章節,課程章節”為例,它的概率通過“課程章節,課程章節”這一轉換組合的頻次除以所有轉換組合的頻次得來。從中可以了解到,學生在登錄網絡課程后,最有可能先瀏覽的是“課程章節”模塊,其次是“體驗區”模塊,極少從其他模塊開始瀏覽。

圖3是展示各模塊間跳轉情況的狀態轉換圖。這里模塊問的轉換概率計算方法與表5又有不同,這里給出的是條件概率。以“問題庫-課程章節”這一轉換組合為例,圖中線條中標明的轉換概率由“問題庫,課程章節”轉換組合的頻次除以“問題庫”這一模塊出現的頻次得來。所以大家會發現,在表5中,“問題庫,課程章節”轉換值的概率是0.007:而在圖3中,“問題庫-課程章節”的轉換概率是0.23。

從圖3中可知,學生一旦進入“課程章節”或“體驗區”模塊,則主要是在本模塊活動,而在中間幾乎不去訪問其他模塊直至離開。“問題庫”、“資料庫”、“常用工具庫”等學習輔助模塊在課程主體部分即“課程章節”學習過程中幾乎沒有用到(學生偶爾從這三個模塊進入,然后轉入“課程章節”模塊,而不是反過來)。這反映了學生學習方法的重要特點,也反映課程的鏈接設計還有改進的空間。

3 學習者視角的學習分析技術應用

對于學習者而言,了解自己的行為表現及與他人的關系將是學習分析技術的主要用途。

選取中央廣播電視大學主辦的網絡教育從業人員培訓班作為研究對象,該培訓班依托Moodle平臺開設(網址:http://etutor.crtvu.cn)。Moodle平臺具有完善的web日志功能,記錄了用戶對每個模塊的訪問及行為方式(瀏覽、增加、修改等),它的“報表”模塊可讓學習者了解自己一段時間的行為概況及行為。一個典型的學習者活動報告(概要報告)如圖4所示。“活動報告”有多種呈現方式,如“概要報告”,展示一個學生在課程各章節的行為表現,“所有日志”將展示一個學生沿著時間維度的行為頻次分布情況,并列出所有行為記錄。基于這些行為記錄,學習者可以了解自己在Moodle平臺中各類功能模塊的活動頻次和活動類型。如表6所示,是該門課程學習過程中,師生訪問平臺模塊的頻次統計結果。

從統計結果可知,學習者可以知道,自己最常訪問的模塊是“討論區”,說明課堂討論是主要的學習活動。相比之下,“資源”模塊的訪問頻次要低很多,這就使學習者反思,自己是否是在充分自主學習的基礎上參與討論的。

學習者在Moodle平臺中的學習不是孤立的,他也想知道與輔導教師、同學之間的關系,這種關系即有無向關系,如對某項資源的共同關注,也有有向關系,如師生在論壇中的回復與被回復的關系。這種關系的呈現可以借助社會網絡分析方法來完成,常用社會網絡分析工具則有UCINET。例如,一位學習者在學完一門課程后,想了解自己在論壇中的回復和被回復情況,此時可以做一個以該學習者為中心的師生交互網絡分析。

師生交互網絡節點由師生群體構成,成員之間的關系通過回復討論區中不同成員所發表的言論而得以建立,屬于信息傳播型社會網絡。在整個培訓班的社會關系矩陣中,矩陣中的行和列分別代表參與網上討論的師生,i行與j列對應的值Zij表示成員i回復成員j言論的次數。其矩陣樣例如表7所示。

采用UCINET中netdraw工具,打開如表7所示矩陣,可繪制以某學習者為中心的師生交互網絡。如圖5所示,即是以學習者“116”為中心的師生交互網絡,箭頭的指向表明“回復一被回復”關系,線條的粗細表明“回復一被回復”的頻次。

在UCINET中,沿著Networks-Centrality-Degree對如表7所示矩陣進行中心度分析,結果發現學習者“116”出度為11,入度為14,即學習者“116”回復了11人次,并得到14人次的回復。由圖5可知,學習者“116”主要回復了“94”、“88”兩位位成員,得到了“158”、“112”、“151”三位成員的回復,與成員“128”、“143”有較為頻繁的交互。

五 小結

21世紀以來,隨著信息化進程在教育領域的推進,特別是數字化校園建設和網絡高等教育的大力推進,教育領域已經部署了眾多的學習管理系統,在這些軟件系統中存儲著海量的學習者信息及學習過程數據。如何利用這些數據,使這些數據轉變為信息、知識,并為教學決策、學習優化服務,而不至于“淹沒在數據的海洋中,卻又忍受著信息的饑渴”,已成為教育工作者以及學習者們所關注的內容。此時,致力于“測量、收集、分析和報告有關學生及其學習環境的數據,用以理解和優化學習及其產生的環境”的學習分析技術有助于發揮學習過程數據的價值,使數據成為審慎決策、過程優化的重要依據。面向未來,本文認為相關研究還可從以下三個方面進一步推進:(1)學習分析技術涉及多種方法和工具,有待整理和比較,以發現不同的方法和工具的適用場合。(2)應用學習分析技術可解決的問題多樣,有待對學習分析技術典型應用進行梳理,歸納出若干典型任務,并整合學習分析技術的若干方法和工具,構建學習分析模式。(3)學習分析技術的應用領域有待進一步拓展,如面向整個網絡高等教育領域,這樣可以發揮更大價值,既為微觀決策服務,也為宏觀決策服務。

編輯:宋樹

主站蜘蛛池模板: 欧美午夜视频在线| 强乱中文字幕在线播放不卡| 亚洲第一在线播放| 中文国产成人久久精品小说| 国内精品伊人久久久久7777人 | 久久精品国产电影| jizz亚洲高清在线观看| 高清精品美女在线播放| 日本三级欧美三级| 亚洲人在线| 综合色区亚洲熟妇在线| 亚洲国产精品无码久久一线| 国产流白浆视频| 无码福利日韩神码福利片| 亚洲精品国产成人7777| 黄色福利在线| 亚洲伊人天堂| 久久性视频| 2021国产精品自产拍在线观看| 国产成人精品第一区二区| 国产精品午夜电影| 亚洲人视频在线观看| 中文无码毛片又爽又刺激| 好久久免费视频高清| 国产97色在线| 国内毛片视频| 国产亚洲成AⅤ人片在线观看| 伊人福利视频| 在线视频精品一区| 国产精品视频999| 亚洲69视频| 亚洲天堂免费在线视频| 黄色网站在线观看无码| 欧美视频在线播放观看免费福利资源| 亚洲一欧洲中文字幕在线| 99热这里只有精品在线观看| 国产成人久久777777| 国产成人1024精品下载| 制服丝袜一区| 91小视频版在线观看www| 午夜性爽视频男人的天堂| 青青草原国产精品啪啪视频| 伊人久久婷婷| 丝袜高跟美脚国产1区| 找国产毛片看| 自拍偷拍欧美日韩| 啊嗯不日本网站| 国产在线精品99一区不卡| 国产小视频免费观看| 91尤物国产尤物福利在线| 亚洲成人精品在线| 波多野结衣无码中文字幕在线观看一区二区 | 免费观看成人久久网免费观看| 九一九色国产| 日韩天堂在线观看| 亚洲人成网址| 欧美性爱精品一区二区三区| 国产成人欧美| 亚洲永久色| 国产特一级毛片| 欧美在线综合视频| 国产精品永久不卡免费视频| 欧美a在线| 91成人在线免费观看| 亚洲欧洲一区二区三区| 97精品国产高清久久久久蜜芽| 欧美日韩亚洲综合在线观看 | 伊人久久久久久久| 精品偷拍一区二区| 99伊人精品| 亚欧美国产综合| 亚洲精品福利视频| 欧美午夜性视频| 国产精品刺激对白在线| 欧美伦理一区| 精品一区二区三区中文字幕| 欧美特级AAAAAA视频免费观看| 狠狠躁天天躁夜夜躁婷婷| JIZZ亚洲国产| 一级一级一片免费| 亚洲女同一区二区| 超碰aⅴ人人做人人爽欧美|