劉悅 蔡飛 陳怡海 王皙 張博鋒



摘要:本文分析了課程建設網站采集的日常教學數據的類型和特點,并針對這些數據,采用統計分析和Echarts技術,以可視化的形式展現了師生的日常教學情況,分析了其與教學效果的關聯關系,進而,提出了基于回歸的學生成績績點預測方法,綜合考慮了學生平時學習各方面的表現,利用Python實現了線性回歸來預測學生的績點。作者以“程序設計方法學”課程為例,應用該方法以發現學生平時表現與教學效果的關系,從而為課程的教學提供良好的決策支持。
關鍵詞:教學數據分析;可視化;回歸
中圖分類號:G642 文獻標識碼:A 論文編號:1674-2117(2018)21-0099-04
隨著互聯網技術的不斷發展,越來越多的高等學校及教育機構開始通過互聯網來進行教學資源的普及和學習。這種教學方式不僅降低了教學成本,而且也極大地簡化了教師的教學方式。因此,許多高校都在研發具有自己特色的在線教學平臺。[1]同時,在線教學平臺上的教學資源以及學生的日常行為信息隨著教育范圍的擴大也在不斷豐富。這些資源和日常教學情況信息都可以用來幫助平臺管理者改善學生體驗和增進學習興趣。然而,如何從這些數據中提取有用決策信息,是一個亟待解決的問題。針對以上問題,數據分析以及可視化方法提供了一種處理方式。數據分析是實現數據價值的重要途徑,通過數據分析可以總結出數據中出現的規律,從而更好地理解現實,實現基于數據的決策。[2]而數據可視化充分利用了人們對可視模式快速識別的自然能力,完美地提高人們理解及分析數據的速度,幫助人們更有效地對海量數據進行挖掘,從而突破教育大數據分析的桎梏。[3]
在線教學平臺的興起,也引發了在線學習分析的熱潮。強津培等人(2016)[4]實現了數據驅動的教學數據可視化平臺,并將其運用到不同學科的教學實例中。該平臺不僅能夠滿足跨學科的教學平臺功能,而且能夠通過可視化技術和交互技術,激發學生的學習興趣。李嬌嬌等人(2017)[5]在數據可視化相關理論與技術的基礎之上,以華中師范大學自主研發的云課堂為例對教育數據進行分析,包括對用戶的分析、對數據模塊和類型的分析,并基于數據類型和可視化技術分類對數據可視化的布局進行分析,針對教育數據中不同數據類型來選擇合適的布局方法。劉海等人(2018)[6]在分析教學平臺數據特點的基礎上,提出了一系列面向教學場景的數據可視化方法,并結合自主研發的師大云課堂,將數據可視化方法應用到實際教學中。另外,國外在數據驅動的可視化在線教學平臺技術方面也有相應研究。比利時魯汶大學Govaerts等人[7]通過一個內嵌在網頁上的應用程序記錄學生在課程中參與活動的情況,并將數據進行可視化分析,以折線圖、平行坐標、柱狀圖等方式顯示學生的學習情況,為學生提供反饋,以促進他們更好地學習。與之類似,普渡大學的“警告信號系統”[8]則通過從網絡教學平臺以及課程成績簿中收集信息來形成學生學習困難的層次,分別用綠色、黃色和紅色標示危險等級,進而對學習成績有“危險”的學生進行有針對性的教育。基于數據可視化技術的在線教學平臺需要在表現形式、用戶交互體驗以及算法支持等方面進行研究,根據不同部分的需求進行設計,從而達到對數據以及算法的可視化體驗。[9]
在上海市教委和上海大學提供的重點課程建設項目共同資助下,我們對“程序設計方法學”進行了課程建設,設計和實現了網絡教學管理與分析平臺,積累了多年數據。本文將以“程序設計方法學”為例,分析課程建設網站采集的日常教學數據的類型和特點,然后針對這些數據,分別使用基于Echarts和Python的統計分析與可視化、基于回歸的學生成績績點預測方法對教學平臺積累的數據進行學習,以發現學生平時表現與教學效果的關系,從而為課程教學提供良好的決策支持。
日常教學中的數據分類和特點
隨著信息化在教學中的廣泛應用,越來越多的課程建立了課程網站,網站中匯集了與課程日常教學相關的豐富數據。這些數據大致可以分為以下兩種:第一種是靜態數據,主要指網站中存儲的人(教師和學生的個人基本信息)、課(課程的基本信息)和物(教學資源)的數據以及日常教務產生的各種數據。這些數據通過手工輸入或批量導入獲得,相對來說它們一旦產生變化性不大,但將隨著教學年份的增加而增多。第二種是動態數據,包括網站通過在線答疑采集的師生互動信息、師生訪問網站的日志信息,這些是常常發生變化的。
這些靜態和動態相結合的數據具有多源異構的特點。靜態信息中的師、生和課的基本信息、日常產生的作業與考試成績等是結構化數據,教學課件、實驗指導手冊、學生上傳的作業等是非結構化數據,而日志數據則是半結構化的數據。這些結構化和半結構化數據都可以為我們進行數據分析提供良好的數據基礎,也為我們的分析提出了不同的需求。
基于Echarts的教學情況統計分析與可視化
針對教學情況數據中的某些單項情況,我們采用傳統的統計方法進行分析,并采用了可視化技術Echarts[10],以圖表的形式展現數據分析結果,主要包括教學情況總結、師資分析、作業提交分析、互動分析、成績分析等。具體如表1所示。
Echarts是一個純Javascript圖標庫,能夠提供直觀、生動、可個性化定制、可交互的數據可視化圖表,它支持折線圖、柱狀圖、散點圖等,同時還支持任意維度的堆積和多圖表混合展現。我們以“程序設計方法學”課程為例,展現Echarts的可視化效果。
如下頁圖1所示,利用餅狀圖對師資力量進行分析,表明了教師的年齡分布、學位分布和職稱分布,從中可以很清晰地看到師資分布情況;作業提交分析采用折線圖,將每一年作業提交的比例計算后進行展示,從中可以看到同年學生在不同的作業題的提交率變化,幫助教師及時了解學生知識掌握情況,同時也可以看到不同年級學生對同一題的掌握情況不同,從而有針對性地調整授課內容的進度與難度;互動分析采用柱狀圖展現了提問人數周平均變化情況,可以清楚地看到每個學期中提問人數的波動情況;聯動分析將每個學期的總評成績、平時成績和學生人數三者進行對比分析,并采用散點圖進行了展示,散點圖中的數據根據時間的不同進行動態變化,從而發現平時成績與學生總評成績的關聯。
基于線性回歸的學生成績績點預測
1.問題描述
平均績點是評價本科生學習成績是否優秀或者能否順利畢業的最重要的標準,如果平均績點偏低,會給即將畢業的學生造成種種不便,但平均績點計算通常需要一至兩周的時間,具有滯后性,不能及時給學生提供預警。因此,我們可以通過對歷屆學生的成績進行分析和建模,得出學生成績的普遍發展模式。根據這些模式建立預測模型,根據學生現有課程教學數據,包括學生平均出勤、平均作業得分、平均課外實踐得分等信息來事先預測其未來平均績點,為那些學習成績可能不達標的學生提供學業預警,使其提前采取有效措施進行彌補,盡可能避免不能順利畢業的事情發生;同時也可以幫助專業教師針對不同情況采取不同的策略來引導學生完成學業。
2.實驗數據集
實驗數據來自我校2011年至2018年期間開設的“程序設計方法學”課程五個學年學生成績的歷史數據,包括了學生選課人數、作業提交率、學生平均出勤率、平均作業得分、平均課外實踐得分和平均績點,具體如表2所示。
3.實驗結果和分析
基于線性回歸的學生成績績點預測方法主要思想是:首先分析影響學生績點的因素主要有哪些,并利用平臺進行采集和數據預處理,獲得學習樣本;然后利用Python編程實現線性回歸方法,模擬學生平時學習因素和學生績點之間的關系,獲得線性回歸方程;最后通過構建好的回歸預測方程對學生平均績點進行預測。算法的具體流程如圖2所示。
將上述方法用Python實現后對表2的數據進行了學習,獲得如以下公式所示的回歸預測方程。
其中,Y為平均績點,X1為選課人數,X2為作業提交率,X3為平均出勤率,X4為平均作業得分,X5為平均課外實踐得分。通過公式求出的擬合績點如表3所示,模型的均方誤差MSE為0.0054。可以看出,利用線性回歸獲得的績點預測模型可以較好地分析出學生日常學習行為(選課人數、作業提交率、出勤、作業得分和課外實踐得分)與學生績點的關聯情況。
結語
信息技術在教學中的不斷應用積累了越來越多的教學數據。本文通過統計分析和回歸模型對積累的日常教學數據進行了分析與預測,并采用Echarts數據可視化工具對結果進行了圖形展示,教師可以及時了解學生的學習狀況,從而根據學生水平及時調整教學內容、方式與進度,進一步提高課程的教學水平,改進教學效果,提高教學質量。在未來的研究中,我們將不斷積累更多的日常教學情況數據,采集更多門課程的日常教學數據,獲得學生在校的多方面更加豐富的數據(如圖書館借閱數據、參與課外活動數據等),這樣就可以引入機器學習和數據挖掘方法發現更多教與學的規律和特點,為教學提供更好的智能決策支持。
參考文獻:
[1][6]劉海,李姣姣,張維,等.面向在線教學平臺的數據可視化方法及應用[J].中國遠程教育,2018(1):37-44.
[2]覃雄派,王會舉,杜小勇,等.大數據分析——RDBMS與MapReduce的競爭與共生[J].軟件學報,2012,23(1):32-45.
[3]王媛媛,丁毅,孫媛媛,等.數據可視化技術的實現方法研究[J].現代電子技術,2007,30(4):71-74.
[4][9]強津培,戴松.面向教學的數據可視化圖表交互系統研究[J].系統仿真學報,2016,28(9):2101-2108.
[5]李姣姣.面向在線學習平臺的數據可視化研究[D].上海:華中師范大學,2017.
[7]顧小清,黃景碧,朱元錕,等.讓數據說話:決策支持系統在教育中的應用[J].開放教育研究,2010,16(5):79-80.
[8]https://www.itap.purdue.edu/learning/tools/signals.
[10]冀瀟,李楊.采用ECharts可視化技術實現的數據體系監控系統[J].計算機系統應用,2017,26(6):72-76.
作者簡介:劉悅,女,副教授,研究方向為數據挖掘、機器學習。
基金項目:本文工作受上海高校外國留學生英語授課示范性課程建設項目(軟件工程)(上海市教育委員會文件教外〔2016〕83號)和上海市教委重點課程建設項目(程序設計方法學)(上海市教育委員會文件滬教委高〔2015〕37號))共同資助。