薄瑜 夏朝 王璨
摘要:為了讓學生更加直觀的了解自己的個人能力,給學生學習過程改進提供可視化數據支持,本文首先探討了基于大數據的學生能力畫像系統的背景、意義,接下來明確學生能力畫像系統構建的研究目標、學生能力畫像系統構建過程以及學生能力畫像系統構建需解決的關鍵問題,最后對全文進行了總結。基于大數據技術的學生能力畫像系統對教學評價機制的改革和人才培養水平的提升起到了至關重要的作用。
關鍵詞:學生能力;畫像;大數據
1.學生能力畫像系統建立的意義
大數據是近年來快速發展的技術方向,關于大數據的研究與應用與日俱增,并不斷深入影響社會生活。在現代教育事業發展的過程中,將教育數據挖掘與學習分析技術進行有機融合,從而在教育領域建立起有關模型,對影響現代教育的各種因素起到了至關重要的作用。本文利用大數據技術,對學生能力畫像系統進行研究,通過多種信息化和數據挖掘的手段收集與學生相關的學習和能力數據,構建合理的信息模型,通過數據可視化技術展示相關的結果和信息,為學生生成能力畫像,根據能力畫像,使學生認識自己在知識能力和綜合能力上的不足,讓學生更加清楚自己所具備的能力,發現自己的短板并彌補短板。
2.學生能力畫像系統構建的研究目標
學生能力畫像系統構建的研究目標是按照工程教育認證的標準,從八個維度細化出關于學生畫像的特征值,利用特征值結合大數據分析技術進行模型建立,構建出學生能力畫像,通過學生能力畫像評判學生的綜合能力。
3.學生能力畫像系統構建過程
(1)學生能力分析
按照工程教育認證的標準,通過對本校不同的專業的培養方案進行調研,分析出學生應該具有:誠信與決策力、心智習慣、分析與創造力、溝通能力、領導力及團隊合作能力、信息技術及數理能力、全球視野、適應行和探索能力這八項能力。
(2)學生能力畫像系統架構分析
該系統在功能架構上分為4層,視圖層(也稱用戶應用層)基礎信息、學生能力畫像、能力評價;控制器層(也稱業務邏輯層)包括數據安全、數據處理、邏輯處理、身份驗證;模型層包括學生能力畫像模型、能力評價模型;數據訪問層(也稱數據庫層)包括學生成績庫、學生行為庫、用戶信息庫。
(3)學生能力畫像系統構建思路
前期利用Python爬蟲技術進行教務系統、學習通、慕課等平臺的數據爬取,將收集數據儲存至數據庫,人工分析集成學生的實體作業成果進行數據錄入,構建初階數據模型,采用輕型的flask后端框架進行網站平臺的搭建,通過前端UI(echart)進行數據顯示,通過Ajax進行前后端的數據傳遞或直接通過Python回顯視圖,此時用戶登錄之后,Python后端只進行了簡單的登錄、信息計算、數據保存、數據顯示等邏輯處理。然后抽取相應的特征值進行分析,使用ID3算法等不斷對初步構建的數據模型進行合理優化,使學生在使用并平臺的得出的學生能力畫像更加精確,并找出學生畫像的臨界、標準(合格)情況,讓學生更加直觀的了解自己的個人能力。
中期通過JAVA編碼進行實現,通過現有數據,集成Mapreduce對大量的數據節點進行機器學習,強化訓練,不斷地對初構建的數據模型進行統計、衡量、優化。
后期繼續完善平臺功能,為學生展示其更多有用的信息,進行數據挖掘,讓學生能更加了解自己的能力,同時也可在系統中添加一些顯示課程表、四六級課程推送的這樣方便實用的功能。
4.學生能力畫像系統構建需解決的關鍵問題
(1)學生數據的收集
基于大學生現有在校學習信息,通過Python爬蟲進行數據收集,囊括學習通、慕課、教務系統等網絡平臺,再通過人工分析的方式將學生作業、實訓成果等數據進行集成轉換,一同利用分布式儲存的方式保存至數據庫,通過不同專業人才培養方案的課程的調查研究課程于能力特征之間的關系,進行課程模型、作業模型、網課學習模型的初步建立,通過學生對于該平臺的使用,為學生提供登錄接口對其學習數據進行收集,并通過初步模型分析計算出得到學生的基本能力和基本特征,并保存其除隱私外的個人信息。
(2)模型算法的建立
通過ID3機器學習算法的分析,進行建立的數據模型進行優化。其中ID3算法是一種構造決策樹的方式,以信息熵的下降速度為選取測試屬性的標準,即在每個節點選取還尚未被用來劃分的具有最高信息增益的屬性作為劃分標準,然后繼續這個過程,直到生成的決策樹能完美分類訓練樣例。決策樹是對數據進行分類,然后在通過ID3算法的分析之后得出學生的特征值并生成決策樹,對應每一位大學生的信息選用不同的分析方式得出計算結果,根據已有數據進行機器訓練,使其計算結果更精確合理。
(3)學生能力的可視化
借助以往課程成績信息,基于矩陣分解的降維技術,分析學生對具體基礎知識的掌握程度,并獲得每門課程所含有的知識體系。基于這些信息,該系統可以分析出每個學生的個人能力,也可以預測出這個學生在未來發展就業可能性。是通過分析課程、學習記錄、學習成果在能力體系上的相關性來進行能力預測。
5.結語
學生能力畫像利用學生的在校學習記錄數據,將分散層次不齊的數據進行標準化構建數據模型行為,包括課程成績、人才培養課程數據、網絡平臺網課學習記錄等,運用大數據分析手段,量化學生在理論、實踐、修養等多維度的特性,揭示學生的個人能力,基于其數據模型對學生的能力、畢業水平、就業優勢等進行預測,對教學評價機制的改革和人才培養水平的提升起到了至關重要的作用。
參考文獻:
[1]楊宗凱.數據驅動個性化學習[N].中國教育報,2018-11-01(007).
[2]楊現民.教學大數據:推動教育的科學變革[N].中國信息化周報,2018-10-22(014).
[3]何文珍,蔡躍.基于知識圖譜的國外學習分析可視化研究[J].中國成人教育,2018(13):15-21.
[4]顏磊,祁冰.基于學習分析的大學生深度學習數據挖掘與分析[J].現代教育技術,2017,27(12):18-24.
[5]舒忠梅,徐曉東,屈瓊斐.基于數據挖掘的學生投入模型與學習分析[J].遠程教育雜志,2015,33(01):39-47.
作者簡介:
薄瑜(1982.01),女,吉林榆樹人,碩士,副教授,研究方向:大數據技術,工作單位:大連科技學院數字技術學院。
夏朝(2001.08),男,專業:軟件工程,大連科技學院數字技術學院在校生。
王璨(1984.05),女,碩士,副教授,研究方向:計算機推理,工作單位:大連科技學院數字技術學院。