張月


【摘 要】 目前,我國高校大都已經建立了較為全面的貧困大學生資助體系,國家“獎、貸、助、勤、補、減、免”等資助政策體系的逐步完善,保障了貧困生的求學之路。但是由于學生的貧困生申請信息偏于主觀、貧困指標難以量化等因素,使得貧困生認定工作仍然是高校資助決策中的難點問題。因此,尋求一種客觀、高效的貧困生認定評估標準,成為高校資助工作研究的重要內容。本文從收入-支出的高相關性入手,選擇學生的校園消費數據作為學生貧困情況的表征,計算了學生的貧困指數并建立了貧困生認定的回歸模型,之后對學生的消費數據做了聚類分析。最后,本文給出了一個確定的助學金發放標準,作為該校學工部門貧困生評估、資助與監控的有力輔助工具。
【關鍵詞】 高校貧困生 校園消費數據 回歸分析 貧困指數
一、背景及研究意義
目前,我國高校都已經建立了較為全面的貧困大學生資助體系,助學金的評定與發放涉及廣大學生的切身利益,備受各界關注。而現如今的“校園一卡通”是“數字化”校園的重要組成部分,其具有在食堂、超市、浴池、校車等各類收費應用等場所的脫機消費功能。本文通過對燕山大學部分學生的一卡通消費流水數據進行消費行為分析,并提出了相關的策略建議,發揮了校園卡基礎數據的應用價值,從而為該校助學金的評定提供更好的依據。這也對進一步利用校園卡數據進行數據分析與輔助決策有著一定的指導意義。
二、數據處理及統計分析
2.1 數據結構及數據預處理
本文的研究對象是燕山大學的本科生,研究數據由兩部分組成:一是來自燕山大學“校園一卡通平臺”部分同學的消費數據;另一部分是通過燕山大學學生工作處提供的部分獲得助學金的學生名單進而從校園一卡通部門得到的這部分學生的消費流水數據。學生消費流水數據包括在多個校區的食堂消費、超市消費、乘坐校車消費、轉賬以及學生校園卡密碼修改、校園卡掛失等多種信息,較雜亂,所以需要對數據進行適當的處理及匯總。匯總后的最終數據由卡號、轉帳金額、消費總次數、有效交易天數、總消費金額、超市消費金額、超市消費次數、食堂消費金額、食堂消費次數、浴池消費金額、浴池消費次數以及校車消費金額幾部分構成。
2.2 貧困指數模型
本節建立了一個可以直觀反映學生貧困程度的貧困指數模型,也可以稱之為貧困指數算法。
一般來講認為貧困生具備以下幾個條件:
(1)貧困生消費總金額相對較少;
(2)貧困生次均消費金額較少;
(3)貧困生日均消費金額比較少而且日均消費頻率穩定;
(4)貧困生食堂消費比重大,超市消費比重小;
(5)貧困生食堂刷卡次數多,超市刷卡次數少
根據以上五點,可以總結出:
(1)消費次數必須達到必要消費次數;
(2)困指數和消費次數呈正相關,和消費總金額、日均消費金額和次均消費金額呈負相關。根據總結,我們提出了如下貧困指數計算公式
(2-1)
其中,表示學生的貧困指數,表示全部學生的平均消費次數,表示全部學生的平均消費金額。表示必要消費次數控制因子,表示貧困生消費總金額控制因子。這兩個因子分別用于保證貧困生必須在必要消費次數以上和貧困生的總消費金額在平均消費水平的多少以內。
由貧困指數的定義可以看到貧困指數越大學生越貧困,反之則越不貧困。根據前人的經驗,本文中的和均取0.2。
依據貧困指數的大小,我們來判定助學金的發放與否以及發放等級。繼續利用此模型來計算第二部分數據的貧困指數來用于下一節的分析。對于這部分數據,我們區別性別進行計算,并剔除消費總次數小于60的無效數據,最終得到的可用數據為41組。我們利用這41組數據進行下一節的線性回歸分析。
2.3 線性回歸模型
上一節中文章利用學生消費次數和消費金額計算了貧困指數。這一節將進行更加深入的研究。本節回歸中的自變量選取為轉帳金額、有效交易天數、超市消費金額、超市消費次數、食堂消費金額以及食堂消費次數。
2.4 聚類分析
我們來對前面剔除數據之后所得到的41組數據分析一下第二部分數據。對于這部分數據,我們區別性別進行分析,并剔除消費總次數小于60的無效數據,最終得到的可用數據為41組。利用SAS軟件對本文的匯總數據進行聚類分析。
程序運行部分結果見圖2-1。
對比以上聚類結果和前面計算的貧困指數發現,被分在一類的學生其貧困指數也十分接近。這也相互驗證了我們前面分析的正確性。下面再第一對部分中女生的數據做聚類分析。聚類見表2-1和圖2-2。
從上述結果看出當分類結果為四類時,分類效果最好,這與我校現行的規則相一致,說明學校將學生按照不同的貧困程度分為四個等級是合理的。接著根據貧困指數與聚類分析的結果給出助學金發放的如下標準:
三、結論
本文研究的是助學金發放與校園一卡通消費數據之間的關系,首先進行的是數據的收集。接著對部分學生的消費流水進行了分類匯總處理。經過初步對超市、食堂消費比重的分析,暴露出了我校助學金發放制度可能存在著某些缺陷,其公平合理性還有進一步提升的可能。隨后本文又計算了各學生的貧困指數并對學生的消費數據進行了聚類分析。貧困指數與聚類分析結果的吻合為我們今后的助學金的發放提供了一個新的思路,研究表明,聚類結果一般是四類最佳,并且聚類在一起的學生其貧困指數也是非常接近的。所以,可以充分利用貧困指數劃定其標準來使助學金發放更加公平合理。線性回歸分析中所涉及到的變量增多,使得對學生貧困的預測結果更加準確。當然,為了進一步驗證本文模型的準確程度與其可用性,本文的后序工作需要對部分學生進行追蹤調查,看其真實情況與本文通過其一卡通的消費數據分析得到的該生的貧困程度是否一致。