王軍 何旭



摘? 要:隨著學校數字化、信息化與智慧校園建設的不斷深入發展,校園信息系統的應用已經融入學生學習、生活的方方面面,各個信息系統存在大量的學生行為數據,分析研究這些行為數據是目前的研究重點。利用數據倉庫技術將存在于各個信息系統中的學生行為數據集成至數據倉庫,通過數據挖掘分析建立高職學生行為分析模型,進而可以為學生修正學習方法、教師調整教學方式、管理部門精準學生管理提供幫助和建議。
關鍵詞:高職學生;學生行為;數據挖掘;聚類分析
中圖分類號:TP311.13? ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)18-0119-03
Abstract:With the continuous in-depth development of school digitization,informatization and smart campus construction,the application of campus information system has been integrated into all aspects of students study and life. Each information system has a large amount of student behavior data. Analysis and research of these behavior data is recent research focus. Use the data warehouse technology method to integrate the student behavior data existing in various information systems into the data warehouse,and establish the behavior analysis model of higher vocational student through data mining analysis,which can then modify the learning methods for students,adjust the teaching methods for teachers,and provide help and suggestions of accurate student management for management department.
Keywords:vocational student;student behavior;data mining;cluster analysis
0? 引? 言
隨著學校的信息化發展,在眾多的信息應用系統中存在大量的與學生生活和學習等方面相關的行為數據,如果能夠通過提取各個信息系統中相關學生行為數據進行整理、關聯,并進行行為分析,建立行為分析模型,挖掘其中潛在有用信息,可以極大地推動學校各項管理工作的高效運行,實現校園各種信息和資源的高度集中融合。基于此,本文主要將大數據、數據挖掘技術應用到學生的行為分析中,構建和研究可行的高職學生行為分析模型。
1? 研究數據范圍和相關技術
1.1? 研究數據范圍
本研究的研究數據范圍主要是江蘇工程職業技術學院校內的各類信息系統、教務系統、圖書借閱、圖書館進出、課堂考勤、一卡通系統以及相關信息系統的數據。
上述系統的相關學生行為數據分散在各個系統中,需要利用數據倉庫技術(ETL)集中至統一的數據倉庫中,筆者選擇了Kettle開源ETL工具進行數據的抽取、數據格式的轉換和數據最后的加載,Kettle抽取分散存放在各個信息系統中的學習行為數據,然后按照標準數據格式轉換成滿足分析要求的標準數據,最后將這些數據存放至數據倉庫中,如圖1所示。
從上述系統中抽取的數據主要包含:
(1)一卡通系統及其附屬系統中的日常消費數據(包含流水號、姓名、交易賬戶、流水時間、入賬時間、POS機代碼、事件類型、交易額,證件號,卡號等信息);
(2)教務系統中的學生成績數據(包含學號、姓名、成績狀態、成績、補考、重修、類型等信息),課程基本信息(包含課程名稱、課程代碼、學分、周學時、總學時、開課部門、專業方向、課程類別、課程性質等信息);
(3)圖書館系統、各類門禁、考勤系統中的考勤信息(包含學號、姓名、考勤時間等信息)。
1.2? 關鍵技術介紹
數據挖掘是一種從數據庫的數據中發現知識的手段,利用機器學習、統計學習等相關方面的知識和技術,從海量數據中整理、歸納、發現、提取出新穎的、有效的、潛在的、有價值并且可被理解的信息數據的處理過程。
數據挖掘的常用方法是聚類和關聯,本研究主要是采用合適的聚類和關聯算法分析構建行為分析模型,數據倉庫采用SQL Server 2010,從各個信息系統中抽取數據至數據倉庫中,通過數據挖掘分析研究構建模型如圖2所示。
2? 構建行為分析模型
本研究構建的行為分析模型包含:貧困生分析模型、個人信息畫像模型、學生畫像模型、學業預警模型、圖書館進出模 型、體育鍛煉打卡模型、宿舍門禁打卡模型以及異常預警模型。
2.1? 行為分析模型基本評價參數
在構建分析模型之前首先要建立基本評價參數,根據獲取到的數據和本研究的研究目標,確定基本評價參數:一卡通消費的單筆最高消費值、每月的消費總數、每月的消費筆數、消費水平、成績績點值、成績等級、每日門禁(圖書館、體育館、宿舍)進出人數、每月門禁進出次數統計(圖書館、體育館、宿舍)、早中晚消費次數、學生行為狀態等,下面主要以消費水平和學生行為狀態為例。