丁亦喆 張小樂
[摘 要] 大數據在各行業中被廣泛使用和認可,大數據給高校的精準資助工作帶來了新的機遇和挑戰。以學生消費數據作為基礎,針對高校傳統的貧困認定工作中存在的問題和弊端展開討論,研究了利用學生消費大數據進行貧困生身份識別存在的問題,進一步闡述了如何利用大數據對新生進行貧困生身份識別。給出了利用學生消費大數據進行貧困認定的建議。
[關鍵詞] 大數據;精準資助;貧困認定
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 07. 083
[中圖分類號] G647 [文獻標識碼] A [文章編號] 1673 - 0194(2018)07- 0201- 02
0 引 言
隨著科技的發展,社會信息化水平的提高,大數據正在影響著社會進步的方方面面,同時對教育行業也產生了深刻的影響。國家各級行政部門對于“大數據”分別提出了明確目標和發展方向,教育部頒發的《教育信息化十年發展規劃(2011-2020年)》提出“信息技術與教育融合發展的水平顯著提升”這一目標[1]。國家《促進大數據發展行動綱要》公共服務大數據工程專欄提到,“完善教育管理公共服務平臺,探索發揮大數據對變革教育方式、促進教育公平、提升教育質量的支撐作用[2]?!眹以诮逃I域大力進行信息化、大數據建設是因為大數據的客觀性和真實性,每個人很難在大數據面前隱藏自己的真實屬性。通過對數據的收集、整理、處理、分析可以輔助人民進行決策,并提高了準確度。近年來國家一直在開展精準扶貧工作,高校作為教書育人、貧困資助的重要陣地之一,也有義不容辭的責任。大數據的應用也為大學生貧困認定工作、精準資助工作的開展提供了新的方法[3-6]。
1 大學生資助工作存在的問題
大學生資助工作中最困難的問題就是大學生的貧困認定工作?,F階段,以西安石油大學為例,大學生的貧困認定工作是根據大學生生源地所開具的“家庭情況調查表”為根本依據,依照國家規定的貧困生標準,成立班級、專業、年級、學院四級貧困認定小組,自下而上來對大學生進行貧困認定工作,這樣的方法不僅效率低下同時也存在著較多的問題。
(1)認定依據較為單一,信息防偽度不高。由于學校和學生生源地的地理位置相距較遠、通信過程較為不暢,時間和精力上無法做到材料的逐一核實,造成無法辨別“家庭情況調查表”的信息準確度,因此這種單一信息的認定的結果和真實情況具有一定的距離。
(2)在各級的評定環節中,由于各班級、專業存在差異,各班級、專業申請人數也不盡相同,甚至申請人與評定人有一定的人情世故。與此同時,由于在評定時人數較多,時間緊任務重導致工作的準確度大大降低。因此,評議小組也無法完全從全面、客觀、公正、科學的角度來進行認定工作。
(3)部分學生因為心理原因,不想讓其他人知道自己是貧困生從而故意隱藏自己的貧困身份,不申請貧困補助。這種情況下學校沒有辦法識別出學生的真實身份,從而無法將精準資助落實到位。
目前貧困認定和精準資助的工作停留在效率低,準確度不高的現實情況,也極有可能出現“助而不需,需而無助”的情況。大數據的客觀性和真實性在精準資助上的應用可以在很大程度上解決這些問題。
2 消費大數據的建設過程及遇到的問題
隨著信息化校園建設的逐步提升,信息設備、智能設備的普及,每名大學生每天產生的數據量是多樣且龐大的。利用大數據對貧困生進行判別的研究一直沒有中斷,而在眾多數據中,能夠最直接表現貧困生身份的信息就是大學生的消費數據。并且,大學生在校內的消費數據可以進行長時間的收集、整理、分析,最終展現的結果是相對客觀公正的,學生的真實身份很難在大數據面前進行隱藏,同時通過分析可以將學生的部分異常消費進行忽略。因此,利用消費大數據可以在一定程度上提高對學生身份認定的準確度。
利用消費大數據進行貧困生身份辨別的工作主要有四部分組成,即,大學生消費數據采集、大學生消費數據清洗、大學生消費數據處理、大學生消費數據分析。
2.1 大學生消費數據采集與清洗
現在全國大部分高校都給學生配發了校園一卡通,通過一卡通學生可以便利的使用或享受學校提供的各項服務,在提供服務的同時學校也收集了學生的各類信息。例如學生在圖書館借書,學校能夠收集學生的借閱數據;學生在食堂或者超市消費,學校可以收集學生的消費數據;學生使用一卡通進出校園,學??梢允占瘜W生的離校數據等。因此,一卡通產生的信息是龐大且復雜的,記錄了學生在學校的大多數活動。由于本文的研究重點是在學生的消費數據,所以在對數據進行處理以前需要對無關數據進行清洗工作,清洗后的數據僅保留學生在校的消費數據。
2.2 大學生消費數據處理、分析存在的問題
獲得清洗好的數據之后要對數據進行處理和分析。學生在學校的消費數據具有以下幾個問題:
(1)部分學生因為之前獲得過各類型的助學金,而部分學生沒有獲得或者僅獲得部分類別的助學金。導致他們真實消費能力無法準確展現。如果利用日均消費來進行貧困生辨別,則與非貧困學生的區分上很難做出較為準確的判斷。
(2)大學生上學大部分都是遠離家庭,經濟較為獨立。這一現狀也可能導致學生對之前自己無法消費的產品具有較強的消費欲望,而滿足一次消費欲望需要較長時間的積攢才能夠達成。例如,大學生進入校門以后想更換一部自己稱心的手機,由于家里每個月給與的生活費是固定的,所以學生經常會選擇省吃儉用來達成自己的目標。這樣的行為也會對數據的分析產生不良的影響。
(3)由于消費都具有較強的不確定性和隨機性,同樣學生在校園內的消費也具有較強的不確定性。具體表現在學生在學校內的各類消費數據不一定是連續的,即,學生的消費不可能每天的一日三餐都在食堂或者校園內,同時隨機的小型同學聚會會導致多人的消費數據產生異常情況。各種情況產生的異常消費數據也會在一定程度上影響到最終的分析結果。
(4)大一新生在進行注冊報到之后沒有多久就要進行貧困認定工作,由于在校時間很短,一般情況下開學都面臨軍事訓練,導致各類消費數據缺少或不足,能夠證明其貧困身份的只有“家庭情況調查表” 。因此,對于新生的貧困認定也是面臨的問題之一。
綜上所述,單一利用消費大數據進行貧困生的辨別對于現在學校所實行的認定機制是機遇也是挑戰。雖然利用單一的消費大數據具有一定的局限性,但是在利用消費大數據產生的結果,配合傳統的“家庭情況調查表”及當地政府開具的證明材料進行綜合判斷,在一定程度上是可以提高貧困認定的準確度。
3 消費大數據建設的建議
對于上面提到的各類問題,以西安石油大學為例,給出以下幾點建議。
(1)學生在校園內獲得的各類型助學金會直接發送到學生本人的一卡通上,而學生在學校的消費是不連續且隨機的,但是只要是消費就可以記錄消費數據,最終可以統計出學生單位時間內的消費筆數。學生獲得助學金以后,在一定程度上會刺激學生的消費能力,有可能導致系統判斷失誤。由于貧困認定的周期為一年,因此將單位時間設置為一年,將學生一年內獲得的助學金總金額平均到其每筆消費上進行處理,可以在一定程度上反應出學生的真實消費能力。
(2)學生的消費大數據應當是記錄越全、時間越長越好。由于學生消費具有間隔性、主觀控制性、消費異常性,如果僅使用短期的消費記錄進行貧困生辨別,系統會因為學生的持續異常消費行為做出錯誤的判斷,因此越長時間的保留學生的消費數據,系統越能夠更加真實、客觀的做出較為正確的判斷。
(3)通過對大量學生的消費數據進行分析,可以生成學生消費的各類情況,例如食堂消費頻率、超市消費頻率、單筆消費額分布、消費時間段分布等信息,利用這些信息生成數字標簽,利用數字標簽為學生個體生成消費畫像。通過對學生個體消費畫像的進一步分析可以得到一類學生的消費畫像。當新生入學之后,產生一定的消費數據時,可以對新生的貧困身份用這種方法進行簡單的預測判斷,提供一個輔助判斷的分析結果。
4 結 語
大數據的應用可以從海量的、無關聯的數據中尋求潛在的關系。大數據在校園中的應用研究也一直在繼續,本文以學生在學校的消費數據作為基礎開展貧困生身份識別的研究,通過對學生消費數據的深度挖掘,生成學生的消費畫像,再可以利用聚類的方法得到各類學生群體的消費畫像,從而可以為新生的貧困身份識別做出一定的判斷。在系統給出判斷的基礎之上,配合“家庭情況調查表”和政府開具的證明材料,從理論層次來講能夠提升貧困生辨別的準確度,提高貧困生認定的工作效率。當然,學生在學校能夠產生的數據是多樣的,未來應當從多個角度來考慮貧困生辨別的問題。這樣以來,可以提高貧困認定工作的效率和準確度,為精準資助家庭經濟困難學生打下了良好的基礎,能夠更加合理的配置社會助學資源,實現了教育公平。
主要參考文獻
[1]教育部. 教育信息化十年發展規劃(2011-2020年)[J]. 中國教育信息化,2012(8):3-12.
[2]中華人民共和國國務院. 促進大數據發展行動綱要[J]. 成組技術與生產現代化, 2015, 32(3):51-58.
[3]畢鶴霞. 大數據下高校貧困生確認模型構建——基于“模糊綜合評判法”與“模糊層次分析法”集成的實證研究[J]. 高教探索, 2016(8):105-114.
[4]齊懷峰. 大數據背景下高校貧困生類別的判定——以安徽師范大學為例[J]. 高校輔導員學刊, 2016, 8(5):74-77.
[5]王茂州. 大數據視閾下大學生資助工作研究[J]. 中國管理信息化, 2017,20(17):236-237.
[6]秦昌建. 基于消費支出大數據的大學生精準資助研究[J]. 高教學刊, 2017(15):51-53.