李 凱,楊彩霖
(西安開放大學, 陜西 西安 710048)
伴隨信息技術的迅猛發展,以云計算、大數據技術為重要支撐的教學質量監控平臺應運而生。如何利用大數據信息,對開放教育學生的學習行為進行綜合分析與督導研判,全面實現對成人學生個體在學習過程中的全過程監督與服務,及時在學習進程中實現對成人學生適時的提醒和干預,切實推進學生高效率學習行為的落實,提升開放大學整體辦學質量和教育教學水平有著十分重要的現實意義。
當前,開放教育學生大部分以在職成人學生為主體,學習需求由原先的學歷補償已然轉化為對知識、素質與技能的全面提升,他們具有明確的學習目標和學習動力。他們中的大多數已經具備豐富的實踐經驗和社會經驗,但也面臨著許多學習困難[1],直接影響到開放教育的學習質量。
開放教育學生存在嚴重的工學矛盾,他們白天忙于本職工作,不能及時自主學習,有時因工作繁忙不能及時參加面授教學。盡管學校提供了豐富的線上學習資源,然而由于缺乏全過程的學習監督、跟蹤、指導,很多學生都是在期末考試前突擊完成相應學習任務,這在一定程度上降低了學習體驗感和學習質量。
伴隨著終身教育的開展,開放教育已經成為求學者提升自身技能與知識水平的重要途徑,客觀上造成開放教育學生的學習基礎差異比較大。以西安開放大學為例,學生中有的是高中起點,有的是博士研究生,還有些學生因當前崗位需要,報學專業與第一學歷專業存在極大跨度,一定程度上造成了同一個班級學生之間學習基礎參差不齊的現狀。
開放教育學生的主要學習方式為混合式學習,即采用“面授教學”“線上學習”與“自主學習”相結合的方式。學生成績的考核評價主要是以形成性考核(過程性作業)和終結性考核(期末考試)為主,缺乏全學習環節的過程性監督考核,且沒有嚴密的量化標準,不能有效促進開放教育學生各階段學習任務的預警與提醒。
學生畫像也稱為人群畫像,是一種基于提取、分析學生用戶歷史數據,利用數據化、語義化的標簽對學生行為特征進行刻畫,實現對學生信息進行全面概括的工具。[2]
隨著大數據時代的來臨,以大數據為代表的信息技術,正在與教育技術深度融合,通過對教育大數據的深度挖掘,能夠為學校提供精準可靠的數據支撐,助力學校服務水平精細化、學習過程可視化、教學過程智慧化的深度發展,對提升開放教育教學質量,促進學校內涵式發展,推進學科建設,服務地方經濟起到重要作用。
就教師而言,通過對學生日常行為大數據的模型分析,即可精準地掌握學生學習過程與學習效果,及時開展具有針對性和差異性的教學支持服務。對開放教育學生來說,通過可視化的信息界面,直觀了解到自己的學習現狀和同班學習者的學習狀態、平均學習差距,對因未能及時參加面授教學而造成的學習無助感和因缺乏面對面學習交流而求助于網絡學習的學習孤獨感能夠起到很好的彌補作用。
面對海量的教育大數據,如何利用科學的方法挑選出具有“可用信息”的有效數據,進而深度挖掘其背后的豐富內涵,獲得具有重要“含義”的“價值”,是構建學生畫像的重要意義。
大數據下學生畫像的潛在價值與應用,為教育決策、教學設計、過程監督和質量評估帶來了前所未有的顛覆。教育大數據、信息技術與教育領域的融合、發展、應用正在重構當下的教育模式,重塑當前的教育生態。
利用教育大數據構建學生畫像為開放教育個性化的教學支持服務提供了強大的技術支撐,是推動開放教育教學改革創新化和信息化、構建教學管理智能化、教務管理個性化、學生學習精準化的重要舉措[3],也是構建學校智慧化教學服務體系,廣泛應用優質教育資源,提升教育教學質量的有力保障。
構建學生畫像最主要的任務是利用便于理解的語義化標簽或便于機器提取有效信息的短文本標簽來描述用戶的行為和特征,通過機器學習算法和規則挖掘分析算法提取高度精練的關鍵詞[4-5],在此基礎上,抽象出一個立體的,以真實用戶群體數據為代表的虛擬畫像。
通過對西安開放大學開放教育學生學習行為大數據的采集、建模和行為驗證刻畫出的學生畫像,進一步了解該校開放教育學生的學習習慣、學習特點、成績水平等重要特征,幫助教師及時準確掌握成人學生的學習狀態和學習效果,以預警形式對存在“學業危險”的學生發出提醒,及時督導學生順利完成學業。
設計學生畫像,能夠貫通西安開放大學大數據管理和應用的各個環節,通過大數據采集,建設教學質量監控平臺。采用多層架構方式,將大數據處理、大數據交換與共享、基于關系型和統計型大數據存儲、權限管理、大數據分析挖掘等進行有效整合并重復驗證,構建出適用于多維異構環境下學校的大數據處理要求、實現海量數據高效管理的可視化平臺,其核心在于對學生行為的數據挖掘。
數據挖掘,又稱為知識發現,是指在大型數據庫中對有價值的信息進行獲取,實質是指從大量的無規則、有雜質的數據中提取出具有“價值信息”的過程。[6]主要工作是通過對雜亂無章的數據,建模找到數據和行為之間的關系,通過預測將行為數據回歸為真實變量。[7]
數據挖掘過程一般由數據整理、數據挖掘和結果解釋與評估三個部分組成,它是將數據倉庫與機器學習、數理統計、人工智能、模式識別及可視化技術等諸多領域的理論與技術相互滲透的一門交叉性學科。[8]
數據挖掘的先導是將學生行為大數據分類篩選(如圖1 所示),通過對學生在日常學習過程中的行為數據采集、傳輸、存儲,分析學生學習行為的基本屬性并進行歸類總結,找出其隱含的內在規律,精準定位學生的學習行為特征,實現對開放教育學生學習行為的綜合評價,并對學生學習進行預測、預警和指導。

圖1 數據挖掘模型
對學生畫像的描繪,實質就是獲得最終數據可視化的直觀展現,集中反映在對學習行為大數據的篩選。以西安開放大學為例,開放教育線上學習的主要平臺為國家開放大學學習網,學生的行為數據主要表現為登錄次數、學習時長、學習參與情況等。經過長期的教學實踐,在綜合分析學生行為后,按照學校開放教育學生特點,選取線上學習活躍度、線上學習參與度、線上學習持久度、學習效果和學習預警五個維度對學生學習行為進行畫像構建[9],具體如圖2 所示。

圖2 學生行為畫像個體指標
(1)線上學習活躍度:30 分。線上學習活躍度主要關注學生線上學習的有關活動,包括學生登錄國家開放大學學習網的相關行為記錄數據,如登錄日期、登錄次數、行為次數等,進行實時動態呈現與分析。
(2)線上學習參與度:30 分。線上學習參與度主要關注學生在國家開放大學學習網上的各類活動情況,參與課程教學討論的發帖數、回帖數,參與各種線上直播課程的登錄情況。
(3)線上學習持久度:15 分。線上學習持久度主要是考核學生在國家開放大學學習網上進行學習的時長,查看各項課程教學輔導資源,觀看各章節教學視頻、參與課程形成性考核作業的累計時間。
(4)學習效果:15 分。學習效果主要是學生每個學期進行注冊學習的各門課程的考核情況,包括每一門課程的形成性考核作業和終結性考核的完成率、及格率等。
(5)學習預警:10 分。學習預警主要針對以上四項指標,設定閾值標準對未達到相應學習目標的學生給出分類預警,及時提醒學生按要求完成學習任務,包括行為預警、形考作業預警、終考作業預警等。
一般來說,學生行為數據散亂無序,首先需要將噪聲數據進行清除,即對原始數據進行預處理,提高數據質量。目前西安開放大學現代教育技術處專門建立了相關數據統計分析系統,通過對學生線上學習行為的跟蹤采集和特征選取構建專業系統數據庫。
學生行為畫像主要是通過學生學習行為大數據的分類、匯總建立相應特征標簽,構建多維度模型,直觀展示學生學習行為的主要特征。
學生畫像行為數據構建分析過程是按照教育大數據各種不同層次和維度聚類劃分后所表現的標簽集合,是描述開放教育學生學習行為的量化指標。有別于對學生學習行為數量的單一化的累積統計,也不是對全體學生學習行為的平均化計算。學生畫像代表的是單個學生在學習過程中所發生行為的特征描述。基于對學生畫像的行為分析,有助于對開放教育學生學習行為的引導和規范,促進學生全過程學習的參與感和榮譽感。
對開放教育學生的畫像過程(如圖3 所示)就是挖掘個體學生在學習中的行為特征,并將其標簽化,通過構建語義化的標簽集合,描述個體學生的學習特征,在大數據行為的基礎上,發掘出行為數據與學習行為的潛在規律,對發現有異常行為的學生及時進行預警提示,確保學習質量的過程性監控,繼而實現對開放教育學生學習全過程的規范化監督和指導,幫助成人學生提高學習質量,增進學習體驗感。

圖3 學生畫像的過程
學生畫像是通過各種直觀的可視化圖形對學生學習特征進行直觀呈現的方式,學生畫像對直觀了解學生個人特點、學習特征以及潛在學習問題具有十分重要的意義。根據學生的日常學習行為,基于統計分析方法采用行為畫像模式,構建學生畫像。
學生畫像不僅能夠幫助學生個人及時了解自身學習情況,還可以通過學習效果展示區了解本學期所學課程的完成情況。同時,直觀展示出自己的學習軌跡及在校期間參與的活動和獲獎情況。通過西安開放大學智慧學習質量監控與支持服務大數據平臺對學生畫像的可視化展示,既能夠增強學生及觀察者對個體學習行為的顯著性視覺感知,同時也可以為整個開放教育學生群體進行分類解析,為進一步提高學生管理工作的科學性與準確性提供客觀依據。
(1)學習行為預警。學生學習行為的預警主要表現為成績預警,目的是對偏離正常學習軌道的學生及時進行提示,幫助學生更好地完成專業學習。在形成性考核和終結性考核完成前,智慧學習質量監控與支持服務大數據平臺會自動根據學生的學習登錄次數和完成質量情況,及時生成相應的學習報告。對潛在存在考核不合格的課程及時進行分類預警提示,通過設置一定的閾值范圍,按照顏色級別,分級警示學生異常學習情況。及時提醒學生查漏補缺,幫助學生更好地完成專業學習,實現西安開放大學教育管理的精準化和個性化服務。
(2)綜合分析報告。通過對開放教育學生學習行為的畫像構建,西安開放大學智慧學習質量監控與支持服務大數據平臺從多個維度展示了學生自身學習行為和學習特征,有助于教師對學生學習過程的統籌規劃和日常管理,也有助于學生直觀了解自身學習情況及與優秀學生之間的差距。分析學生個體畫像,還能夠綜合剖析學生成績上升、下降的原因、個體學生學習行為喜好、上網時長及流量使用趨勢。借助維度篩選還能夠了解特殊學生的行為特征,及時加強對該生的跟蹤指導,幫助學生順利完成學業。隨著西安開放大學智慧學習質量監控與支持服務大數據平臺的不斷使用,學生畫像學習信度也在模型的日益完善中不斷提升,盡管取得了一定成績,但也存在一些不足。
西安開放大學緊密圍繞學生行為大數據開展了智慧學習質量監控與支持服務大數據平臺構建,通過平臺建設,針對學生學習行為進行個體畫像,實踐應用中發現了一些不足,主要表現為:一是行為數據的共享融通存在障礙。由于開放大學平臺特征,學生學習行為數據主要來自于國家開放大學學習網和西安開放大學選修課云平臺,因兩學習平臺暫不兼容,數據融通存在障礙容易形成數據孤島。二是數據標準存在差異。不同學校在數據標準選擇時,會根據各自學校特點進行權重傾斜,因此同一平臺難以做到所有數據的標準統一。三是數據挖掘深度不夠。大數據的海量特征,使數據的深度挖掘成為難題,在西安開放大學智慧學習質量監控與支持服務大數據平臺建設中,受技術影響還未能完全做到對學生行為大數據的深度挖掘和分析。四是數據安全存在風險。網絡信息安全涉及每一位公民的隱私,如何保護教育大數據的數據安全,目前還沒有專門的法律法規,保護不當可能會引發一系列教育倫理問題。
針對以上不足,西安開放大學積極努力不斷探索,從以下四個方面進行響應:一是融通學習平臺,針對學生行為大數據的有效融通,學校積極做出調整,將國家開放大學學習網作為唯一教學平臺數據來源,同時加強與國家開放大學數字資源中心對接,便于數據采集。二是完善數據指標,不斷加強數據指標體系建設,打造規范化標準,實現教育大數據的共享、統一。三是提升數據處理水平,引進專業技術人員,構建多層級、多維度分析團隊,實現對潛在價值數據的深度挖掘和分析,提升教學服務管理水平。四是規范安全制度,在西安開放大學范圍內建立相關制度標準,定期對專業人員進行培訓,提高思想認識,保障學習數據安全。
西安開放大學智慧學習質量監控與支持服務大數據平臺的建立,目的在于幫助學生獲得更好的學習體驗感和參與感。將開放教育學生的自主學習轉化為對學生個性化的支持服務,針對不同學習者的個性化畫像特征,及時推送具有針對性、差異性的教學服務,在深度挖掘開放教育學生個性化需求的基礎上,提供精準匹配的過程指導,及時干預異常學生的學習行為,實現開放教育全過程的實時化、動態化監督管理,充分利用教育大數據資源,提升學校整體管理水平。同時,為學校管理者提供相關決策依據和決策支撐,提升成人學生的學習自覺感和緊迫感,全面實現西安開放大學的高質量轉型發展。