竇琨


關鍵詞:大數據;消費行為分析;一卡通
1引言
隨著智慧校園建設的蓬勃發展,學校建設的重點也從基礎設施建設轉移到應用系統建設和大數據建設,從而助力學生成長、教育教學、學校管理的發展變革。2015年,相關部門印發《促進大數據發展行動綱要》,明確了教育大數據發展的方向,在決策支持、師生服務、優化管理等方面開展重點建設,探索大數據對變革教育方式、促進教育公平、提升教育質量的支撐作用,大數據已成為推動高等教育創新發展的重要引擎,也是促進高校教育管理現代化轉型的強大技術力量。本文主要以學生一卡通消費數據為對象,通過大數據技術,抽取學生一卡通消費數據、學生基本信息、人事基本信息等進行數據加工處理,以分析學生的就餐和消費行為,并進行預警,可以通過大數據分析判斷異常消費,并進行預警,也可判斷學生家庭情況,對嚴重低于平均消費的學生重點關注,及時與學生溝通,幫助其解決生活困難,實現對困難學生的關心關愛,從而發揮大數據深度應用的價值,并以數據大屏展示分析結果,實現監測和預警。
2分析與預警目標
基于大數據的學生消費行為分析和預警的主要目標,分析學生刷卡消費流水數據,針對刷卡次數、金額等異常波動進行預警,輔助學生管理工作者發現三餐不規律、經濟困難學生、接待外校人員或接受異常資助等現象,對某特定時間段內一些人不就餐的情況進行特別預警。支持從校級、院級、輔導員等不同視角查看群體和個人的消費分析和預警情況。
3平臺總體架構
基于大數據的學生消費行為分析與預警平臺以數據大屏模式進行展示,分析和預警主要有學院級、分院級和班級三種視角。總體框架有:校園基礎數據源、大數據基礎運行平臺、分析預警展示平臺。展示平臺包含智能預警、數據挖掘、多維分析、關鍵指標等。大數據基礎運行平臺負責相關數據的收集,并將收集到的數據進行結構化存儲和清洗:綜合分析主要是對采集到的大數據分析建模,再對其進行深度挖掘和智能化分析:智能預警主要是利用分析結果對學生的異常行為進行智能預警以及自動生成對應的監督措施。
學院級視角一般提供給學校相關部門,如學生處、后勤處等進行瀏覽,可從歷史、本年、本月維度展示消費總額和單筆消費最高金額等分析比較數據,可設置消費額度區間并進行統計,以及展示三餐就餐率、不同分院人均消費金額,同時對異常消費金額、異常消費次數、經濟困難學生等進行預警,并能統計出特殊時間段的異常消費人數。
分院級和班級視角一般提供給各分院、班級相關負責人瀏覽。可顯示消費信息、預警信息、三餐就餐率等,并且三餐就餐率、單餐人均消費可以與學校整體水平進行比較。可對異常消費金額、異常消費次數、經濟困難學生、特殊月份消費異常進行預警。
4大數據分析及算法
采集校園智慧食堂系統門店消費流水數據、校園人事系統中班主任輔導員數據、學生工作管理系統中學生基本數據和院系組織架構數據,匯總相關基礎數據源至大數據中心,建立數據采集轉換任務,并通過數據治理、清洗,形成標準數據,存儲在數倉標準層,并篩選相關數據導入主題庫,通過設計物理模型,匯總相關數據建立寬表,再疊加邏輯分析模型,生成分析數據,構建專題庫。各類分析結果再次疊加分析可獲得多維度分析數據,識別異常數據生成預警信息,最終推送至可視化平臺進行監測和預警展示,數據處理過程如圖1所示。
4.1數據處理
通過數據接口或中間庫對接的形式定時接收智慧食堂系統推送的一卡通消費數據,數據中包含消費時間、金額、檔口編號、機具編號等重要的數據源,對源數據的分析不在原業務系統內進行,而是將學生的消費流水數據提取到指定的數據庫中,把數據處理成可用的數據后再分析。一卡通消費數據中包含大量信息,根據分析需求對消費數據進行清洗,去除包含噪聲的無意義數據以及無用的字段,并對清洗后的數據進行數據轉換,形成標準數據。
4.2數據倉庫
建立消費行為分析主題庫、教職工基本信息主題庫、學生基礎信息主題庫。其中消費行為分析主題庫由多個專題表構成,包含時間(包括區間時間)、三餐、金額(包括區間金額)、消費次數等多種數據,并在專題表的基礎上通過開發平臺生成寬表,更好的支撐數據查詢和BI呈現。而教職工基本信息主題庫、學生基礎信息主題庫主要為消費行為主題庫提供學生信息,負責教師信息,權限層級劃分等各類擴展信息的數據支撐。
4.3建立模型
邏輯模型的建立主要用于劃分數據維度,對學生基本信息、消費流水、消費終端信息等數據進行分類儲存、數據簡化、同屬類別歸并,邏輯模型如圖2所示。建立物理模型的目的是構建合理的數據庫物理結構,通過合理規劃數據庫的結構、字段、索引、存儲等來實現模型的建立,從而可以清楚地對一卡通消費數據進行分析。
5分析與預警
消費大數據分析與預警體現在很多方面,如多維分析、智能預警、關鍵指標、專題分析等。其中多維分析可以從學院、分院、班級等維度分析學生日均消費、單餐消費、最高消費、三餐就餐率等。智能預警主要利用平臺所分析的結果對學生的異常行為進行智能預警以及自動生成對應的監督措施,例如消費金額異常預警、刷卡次數異常預警、經濟困難學生識別、特殊月消費預警等。
5.1三餐就餐率分析
以班級為合集,將滿足一定消費比例的日期作為交易日判斷條件,通過邏輯模型計算出不同班級的交易日,以該交易日作為其班級成員就餐日的標準,抽取其在特定日寸間段(三餐),特定額度區間的消費情況,甄別該學生三餐就餐情況。以此為前提,建立學院、分院、班級三個集群維度,以日、月、季、年或特定月份的時間維度形成三餐就餐率信息匯總。對于單一學生,對其就餐率不同的區間予以不同的顏色進行顯示,計算其三餐平均就餐率及總平均就餐率,甄別其就餐不規律等異常行為。
5.2消費金額異常預警
以24小時為周期,以單一學生為個體,檢索其歷史消費記錄,橫向比對其上一個時間維度和近期消費金額的差異,抽取差異數值過大的學生的相關信息,通過特定的文本形式及消息管理平臺,推送給負責該學生的管理員。與此同時,檢索單一學生不同時間維度的平均消費金額和消費次數,分析其可能存在的異常狀態,如疑似貧困生大量時間內的低額消費,疑似被盜刷的短期內大額度消費等。
5.3經濟困難學生識別預警
相關研究表明,貧困生尤其是特困生在食堂里的用餐次數明顯高出非貧困生:貧困生在食堂的整體用餐金額低于非貧困生:貧困生的用餐金額相比之下更為穩定。以24小時為周期,以單一學生為個體,檢索其歷史消費記錄,橫向篩選其在一段時間維度內,滿足一定消費次數(同時滿足一定消費金額,篩除購置零散物品的消費記錄)的平均消費金額,并以這些數據為消費特征數據,根據聚類算法建立經濟困難學生認定模型,篩選出消費水平較低的學生進行預警。并以班級、分院為集群維度,統計觸發該類預警學生總和。
5.4特殊月異常消費預警
以班級作為合集,將滿足一定消費比例的日期作為交易日判斷條件,通過邏輯模型計算出不同班級的交易日,以該交易日作為其班級成員就餐日的標準,抽取其在特定時間段(三餐),特定額度區間的消費情況,甄別該學生三餐就餐情況。同時,以單一學生為個體,檢索其歷史消費記錄,統計其在特定時間周期,特定時間段(三餐),特定額度區間的消費情況,計算出三餐就餐率和總就餐率,對就餐率低于指標值的學生進行預警,并以班級、分院為集群維度,統計觸發該類預警學生總和,通過權限模型和管理駕駛艙,展示給相應權級的管理員。
6實現價值
6.1家庭困難學生認定
通過分析學生日常消費數據,根據學生的消費行為判斷學生的家庭收入情況,從而為家庭經濟困難學生的認定提供輔助決策支持。在實際學生工作中,經過調研顯示,平臺預警的這些經濟困難生確實都是家庭困難學生,其具有一定的實踐應用價值。
6.2提升后勤服務水平
通過對學校的消費數據進行詳細分析,發現群體消費的偏好以及潛在的問題,能夠向后勤處管理層展示校內營收情況,發掘熱門及冷門消費地點,為校領導綜合判斷商家提供決策依據,為學校商家和食堂分別提供其在校內的營收情況,幫助其了解自身的營收流水和客戶類型等,為其后續開展營銷提供依據。
6.3關心關愛學生
通過分析學生大額消費、三餐就餐率,展示個體消費曲線及就餐率曲線,督促學生養成好的生活習慣和消費習慣,樹立正確的消費觀,對異常消費行為做出科學的引導,對特別貧困生進行密切關注及心理疏導,對學生的關心關愛更加精準。