付麗琴
摘要:教師職能已由傳統的課堂講授轉變為設計、組織、幫助與指導學生的學習,而學習分析成為了現代教學中必不可少的輔助手段。與此同時,大數據技術的出現為數據的分析應用提供了全新的思維和方式,大大推動了教學的個性化、適應性研究。本文以大數據為背景,結合云存儲技術,以教師教學設計為應用目標,討論學習分析的內容和關鍵技術,包括學生學習體驗數據的獲取、存儲和分析。
關鍵詞:學習分析;大數據;云存儲;教學設計
引言
隨著Internet、4G等信息技術的普及,以及MOOC等開放教育資源的日漸豐富,學生獲取知識的渠道快速增加,基本實現了隨時隨地的學習。學習方式的改變導致了教師角色的轉變,教師不再是知識的唯一傳授者,而成為學生學習的干預者和引導者,教師職能由傳統的課堂講授轉變為設計、組織、幫助與指導學生的學習。在此環境下,教師的主要任務就是為學生量身定做最合適的學習環境和個性化指導,具體包括兩個方面:一是設計以學生為中心的教學方案,二是設計以學生為主體的教學形式。為了完成此任務,教師不僅要充分利用知識的結構和內在聯系,而且更多地依賴于對學生狀況的了解,只有預先了解學生的學習特點,才能做出恰當的教學設計。因此,學習分析成為現代教學中的必要的輔助手段。2013年美國新媒體聯盟(NMC)的《地平線報告》提出,2~3年內學習分析這項技術將會被廣泛接受。
聯合國在2012年發布的大數據白皮書“BigData for Development:Challenges& opportunities”中宣告了大數據時代的到來。大數據時代為數據的分析應用提供了全新的思維和方式。在高容量、高速度、多樣化數據結構的大數據時代,我們不僅可以借助云服務端來存儲海量的結構化、半結構化和非結構的數據,還可利用數據分析和數據挖掘技術從這些海量數據中提取具有重要價值的信息,從而對包括教育領域在內的社會各個領域的發展產生巨大的推動作用。
“數據驅動學校,分析變革教育”的大數據時代已經來臨,大數據技術使得我們可以獲取每個學生的海量時空軌跡的行為數據,包括學生在學校里發生的每一件事情,學習過程中的全部表現,以及在家用計算機終端學習過程中的一舉一動;然后,基于大數據的云計算平臺,教師不但可以對反映學生學習成果的各種量化或質性數據進行分析預測,還可以對學生在學習活動中以及虛擬情境中的非結構化行為進行分析,最終利用學習分析的結果做出最適合學生的教學設計,并且為學生推薦學習軌跡。
一、學習分析的內容
以學生為中心的教學設計,包括為學生設計合理的學習任務單和課堂教學形式,提供相關的教學視頻和學習資源等。大數據時代的教學設計依賴于教師對學生學習狀況的了解,學習分析是從整個系統的角度出發幫助教師做出教學決策,學習分析需要對學生學習過程中形成的海量數據進行解釋和分析,以評估學生的學術進展,預測其未來表現,并發現影響學生學習系統的因素,其目的是評估學生、發現潛在問題并最終優化學習,對象是學生及其學習環境,基礎是海量數據。
為了準確地了解每個學生的學習需求,不僅要對學生當前的學業表現進行多元化評價,還要在一定程度上預測學生的未來表現,要對每個學生進行全方位的發展性評價。為此,我們需要全面地跟蹤記錄一個學生的所有表現,既有量化的也有行為表現的,既有課內的也有課外的。根據大數據時代學生學習方式的多樣化和靈活性特點,學生的學習數據包括線上數據和線下數據兩種。對這些數據進行挖掘和分析,可以全面跟蹤和掌握學生的學習行為、學習過程和學習特點。學習是學生與學習內容、教師、合作同學和學習環境之間的復雜交互過程。
(一)線上學習的評估內容包括:
1.學生在線學習表現的統計描述,包括學習時間的投入(如學生在某個知識點上花費的時間)、學習活動頻次(如學生對某個知識點瀏覽的次數)、學習資源瀏覽(如學生對教學視頻中某個片段瀏覽的次數)、考試成績等;
2.學習者自主學習路徑,包括學習者提問、回答相關問題和師生交流(如師生交互行為分析、師生發帖的內容分析、師生交互的社會網絡分析);
3.影響學習者在線學習表現的各種因素,如學習者的興趣愛好;
4.各種虛擬情境下的學生表現,包括社會態度、責任感、處事方式等。
(二)線下學習的評估內容包括:
1.學生在學習不同模塊的階段性成績和課堂觀察結果;
2.實訓表現及過程感受;
3.實習、實訓等環境的適應情況;
4.學習活動中與人溝通交流、團隊合作的表現。
二、學習數據的獲取與存儲
(一)學習數據獲取
學習數據是指通過對學生學習過程中所產生的學習日志進行濾處理后得到的數據。學習數據的類型非常豐富,其中一部分數據是事后搜集的,如采用傳統的考試分數采集的定量數據,以及通過文件、檔案記錄、深度訪談、參與式觀察等多種方法采集得到的質性數據等。大部分學習數據是在學生學習過程中自然發生的數據,是即時產生的,需要實時采集。實時數據的采集主要依賴于傳感器、射頻識別技術或專門軟件等,例如,我們可以利用圖像傳感器捕捉學生在觀看教學視頻時的視線移動,用專門軟件跟蹤記錄學生學習時長和完成習題檢測的全過程,包括讀題的時間、做題的順序、做題時間、解答過程等;為了研究學生的學習與心理動態,可以在線采集他們的行為蹤跡、交友網絡和微博等半結構或非結構數據;為了了解學生的價值、態度和道德養成,可用軟件記錄學生對學術活動和社交活動的參與情況等。
經過各種渠道獲取的學習分析數據的種類和結構非常復雜,只有少部分是結構化數據,大部分是難以計量和分析的非結構化數據,如學生的學習路徑、學習體驗及學生對環境的感受等等,這些數據用傳統數據處理方法有很大的困難,需要先將結構復雜的數據轉換為單一的或是便于處理的結構,然后才能做數據分析。
除直接采集的數據外,還可以利用其他信息化管理系統中的數據,如學生處、教務處等高校業務部門的數據管理系統中的數據。由于不同部門運用不同的數據系統軟件,各個運行數據庫除包含進行學習分析所需的有用信息外,還會摻雜很多干擾信息,因此需要將多種來源的數據進行篩選,以主題為目標,建立以分析為主要功能的數據集合。
(二)學習數據存儲
將結構和非結構化的學習數據及時存儲到數據中心是實現數據訪問和實時分析的必要前提。直接采集或從各部門數據庫得到的學習數據具有不同格式,傳統數據存儲的方法需要解決過濾后數據的異構性問題,如采用聯邦式、基于中間件模型和數據倉庫等方法。云存儲技術不但能夠兼容不同結構的數據,而且屏蔽了數據丟失、病毒入侵等問題,是安全可靠的數據存儲技術。利用云存儲技術來構建學習數據的存儲環境,根據數據的類型、結構不同而選擇不同的數據存儲方案,使各種類型的數據實時高效地同步到數據中心。
要對海量數據進行有效的分析,還需將這些來自前端的數據導人到一個集中的大型分布式數據庫,或者分布式存儲集群。云計算開源平臺Hadoop提供了分布式文件系統、分布式數據庫以及數據分析處理等功能模塊在內的完整生態系統,現已經發展成為目前最流行的大數據處理平臺。基于Ha-doop來構建學習數據存儲平臺,具有數據管理方便、訪問速度快等優點。
三、學習分析
學習數據分析是對教學內容、教學環境和學生學習活動中產生的各種結構和非結構化數據進行相關性分析的過程。在進行學習分析時,采用面向主題的數據組織方式。主題(subject)是在較高層次上將信息系統中的數據進行綜合、歸類和分析利用的一個抽象概念,每一個主題基本對應一個分析領域。根據教學設計需求,我們選擇三個主題實現學習分析:學生學習成果、學習體驗和學習能力,其中,學習能力既反映了學習的效果,又是預測學生未來學習表現的關鍵因素。
每個主題細分為幾項內容,每項內容都是若干分析對象數據的一個完整描述。Fulks認為,學生學習成果是期望學生在經過學習后應該獲得的、具體的、可測量的目標和結果,包括認知、技能、態度等,因此,反映學習成果的內容應當包括知識掌握程度、知識應用的能力、口頭與書面表達的能力、獨立制訂計劃的能力、創業能力、社會能力和社會責任意識等;學習體驗是指學生在學習過程中對學習內容、任務安排、教學環境等的感受,以及實訓感受和對學習成果的滿意度等;學習能力指學生獲取信息、接受知識和應用知識的能力,具體包括:學習速度、領悟能力、獨立思考能力、獲取與利用信息的能力、分析判斷與決策的能力、遇挫表現、學習活動中的應急和應變情況、與其他學習者的互動與合作等。
在Hadoop平臺上,利用分布式數據庫或者分布式計算集群,來對存儲于其內的海量學習數據進行分析整理,如對學生的學習行為、學習成果等非結構數據進行維度分析和關聯規則分析等以推斷出各種類數據間的細微差異與關系,所得出的信息以可視化技術直觀地顯示,為教師教學決策及時提出預警和幫助。
四、結束語
大數據技術可以高速實時地處理不同結構的復雜海量數據,并對大量不相關信息進行深度復雜分析,可以幫助推動教學的個性化、適應性研究。利用大數據技術和云計算提供的軟件、存儲、安全等技術,對學生學習活動中產生的數據進行分析,了解學生真實的學習狀況,使教師能夠根據學習者的需要選擇和設計教學內容,是提高教學質量的有效途徑。