劉志宏,喻曉旭
(1井岡山大學網絡信息中心 江西 吉安 343009)
(2井岡山大學計劃財務處 江西 吉安 343009)
高等學校作為現代教育的重要載體,在“互聯網+”的時代需順應潮流,推動高校由傳統校園向現代化智慧校園發起轉變,真正做到提高智慧校園的科技水平和服務能力。校園一卡通系統作為智慧校園的重要組成部分,是高校核心業務系統之一,為打造信息化管理的智慧校園提供一種快速、便捷、有效的管理手段。
井岡山大學智慧一卡通系統自2014年建立以來,校園食堂、商超、日常水電及網費充值、圖書館等場所均已投放使用,為全校教職工及學生的日常生活、學習提供了“一卡通”服務,每日對校園卡的使用產生了龐大的數據量。井岡山大學智慧一卡通系統平均每日的消費數據在6~8萬條,全年消費數據約為1620多萬條。本文將采用數據挖掘中的K-means聚類分析算法,通過對龐大的一卡通消費數據進行統計分析,獲取教職工及學生的消費偏好,為高校后勤管理部門的監督管理提供決策支持。
井岡山大學智慧一卡通系統將每天刷卡消費的龐大數據量存放于數字化校園共享數據庫中。為了使數據分析更加規范,對本文所要采集的數據進行處理,包括以下四個流程:數據采集、數據加工整理、數據分析、數據展示。如圖1所示。數據采集直接從智慧一卡通系統中導出全校每日的刷卡消費明細,在對異常數據進行剔除后,將存在數據字段缺省的消費記錄進行補齊處理。

圖1 數據處理流程
一卡通消費數據通過數據采集階段后,需進行加工整理、分類流程。本文按高校人群劃分,將一卡通消費數據主要分為兩大類:教職工消費數據和學生消費數據。每類人群的消費數據均包含三類消費數據:餐飲消費、商超消費、日常充值數據。從數據挖掘的角度出發,本文分析的數據主要為餐飲消費和商超消費兩大類數據:餐飲消費數據主要包括在校教職工及學生在食堂刷卡吃飯的相關數據;商超消費數據是指在校教職工及學生在學校各大商超的消費數據。
K-mean算法又稱K均值算法,屬于原型聚類中的一種基于距離度量的聚類算法。其思想為:(1)從數據集中選擇k個對象作為初始的聚類中心。(2)計算剩余對象與初始聚類中心的相識度(距離),并將該對象劃分至最相似的聚類中心。
(3)計算每個新聚類的聚類中心。不斷重復步驟(1)、(2)、(3),直至標準測度函數收斂。
表1列舉了兩類人員平均每天的消費情況。從表1中可得出,學生在食堂消費的占比為78.84%,商超消費的占比為21.16%,可見,學生的主要消費行為主要發生在食堂的餐飲開支。教職工在食堂的餐飲消費和商超的消費比例基本持平,可以得出教職工偏好于商超消費。

表1 兩類人員日均消費數據統計表
學校食堂菜品單價通過統計基本從2~10元,從圖2中食堂消費水平可以看出,學生的餐飲消費水平較低,消費主要集中于2~6元的菜品,占所有菜品價格比重約為96.10%,高于6元的菜品占比僅為3.9%。教職工在餐飲消費的水平相比較高,消費主要集中于5~7元的菜品。因此后勤在管理食堂定價時,應將食堂菜品單價壓低在6元及以下,以此為學生帶來更多的選擇機會。

圖2 食堂消費水平統計
井岡山大學共有三個食堂,位置分布于南區、北區和中心行政樓旁。從表2中兩類人員在各食堂消費人次及人均消費額來看,同時剔除教室、宿舍分布因素,兩類人員對三個食堂的選擇偏好不同,其中第二食堂在刷卡人次上遙遙領先,人均消費金額達到10.06元。通過實地探訪發現,第二食堂菜品價格更優、口味更符合大眾需求、就餐環境也是三個食堂中最好的。因此管理部門可要求其他兩個食堂向第二食堂學習,使得全校食堂管理水平得到普遍提升。

表2 兩類人員食堂消費統計
井岡山大學共有三個商超,從表3中可看出,井岡山大學在校生日均消費水平普遍較低,人均日消費金額僅為5.99元。對比來看,南區商超的人均消費水平和消費人次略為領先,通過實地探訪獲得的原因是該超市商品種類更齊全,價格更優惠,且教職工消費人次較多。

表3 兩類人員超市消費統計
高校一卡通消費數據的年數據量為千萬級別,屬于大數據范疇,同時涉及不同人群,具有較高的研究價值。本文采用數據挖掘中的K-mean算法對井岡山大學一卡通消費數據進行統計、整理、加工、分析,從教職工和學生兩類人員對菜價偏好、食堂選擇偏好、商超選擇偏好三個方面進行分析,對比得出其中比較成功的經營模式和管理理念,促使后勤管理部門對高校食堂和商超的管理更加科學、規范。