陳昊,楊志邦,廖良梅
(長沙學院計算機科學與工程學院,湖南 長沙 410022)
習近平在首屆國際教育信息化大會的賀信中指出要“積極推動信息技術與教育融合創新發展”[1]。經過長期發展,我國高校學生資助已形成“獎貸助為主,勤補免為輔,外加綠色通道”的政策內容體系,但實施過程中仍然存在家庭經濟困難學生(以下簡稱家困生)界定不準確、資助額度不均衡、資金結構不合理等問題。《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》(以下簡稱“十四五”規劃)提出加速數字化發展,加快數字社會建設步伐,以數字化轉型驅動生產方式、生活方式和治理方式變革。在新時期,全面貫徹習近平關于教育的重要論述,認真實施“十四五”規劃關于教育事業的決策部署,高校需要持續推進學生資助與大數據技術深度融合,利用大數據的融合協同、信息采集、動態分析功能,推進高校學生精準資助工作的優化與升級。在大數據視域下,利用大數據技術對家困生開展精準資助,既是新的思路和方法,也可以逐步解決目前資助工作中的相關問題,因此,借助大數據推進高校家困生精準資助工作的優化與升級顯得尤為重要。
從現有的研究來看,關于高校家困生精準資助的研究主要集中在基于公共政策維度的資助政策改善研究、基于精準扶貧維度的精準資助研究、基于資助育人維度的模式優化和衍生問題研究。結合以上三個維度,針對精準資助的復雜性和動態性,可以進一步探索現有研究及應用層面的不足。
1999年,我國開始實施國家助學貸款政策;2002年,實施國家獎學金制度,獎勵品學兼優的家困生;2005年,設立國家助學金,專項資助家困生。2007 年 5 月,《國務院關于建立健全普通本科高校高等職業學校和中等職業學校家庭經濟困難學生資助政策體系的意見》發布,針對高校家困生采取獎、貸、助、補、減等多種形式進行資助,至此,我國高校基本形成了以獎、貸、助、補、減為主的高校學生資助體系,完善資助政策給資助工作提供制度支撐,為重點幫助經濟困難人口子女接受教育提供了重要保障。在資助政策研究方面,劉志洲等認為學生資助工作中的家困生認定存在不規范、資助比例偏少等問題[2]。洪柳對我國高校貧困生資助體系存在的問題進行了研究,發現我國的資助政策雖然經過了“免學費加人民助學金”“獎學金和學生貸款并存”“多元混合資助”幾個階段的發展,但仍然存在對家困生界定不準確、資助額度不均衡、助學貸款比例有待提高等問題,尤其存在資助對象不夠精準化、提升教育資助的精準性難等問題[3]。現有的基于資助政策的研究還是局限于傳統層面,較少結合新技術、新理念進行探究,缺乏尋求精準資助研究創新方面的研究。
2015年,中共中央、國務院印發《關于打贏脫貧攻堅戰的決定》,對精準扶貧的概念進行了深入的闡釋,由此,精準扶貧成為高校學生資助工作的基本原則。在資助機制與精準資助研究中,隋世鋒等就家困生評審機制問題進行探討,認為目前的家困生評審在建檔立卡范圍之外仍然存在諸多問題,許多重大決策事項缺乏聽證及說明理由,資助信息公開范圍和方式不當等,可能侵犯資助申請人和受資助者隱私權,造成資助過程中學生的公平感缺失[4]。家困生評審由于流程固化、審查不嚴而容易出現不公平的現象,資助結果與精準扶貧的精準要義相背離。徐煥章等以某高校資助執行水平專項審計調查問卷為研究樣本進行探析,發現存在資助政策宣傳不到位、審查正確率不高、執行落實效果不理想等問題[5]。樊永生研究發現,精準扶貧視域下高職院校家困生資助政策和規章制度雖逐步健全,但資助政策落實時依然存在精準識別不徹底、按需資助不充分、資助體系不完善等問題[6]。由此來看,既有教育幫扶政策的實際執行效果與政策制定的出發點存在差距。呂坤等以四川省15所高校為調查對象,對資助政策的實效性進行實地調研,發現在家困生認定中虛構困難戶現象時有發生,存在家困生受外因影響主動“退讓”、認定過程夾帶人情與關系、評審規則不夠具體等現象,給資助工作的效能提升造成障礙[7]。顯然,資助對象的精準認定是實施精準資助的前提條件,是提升資助政策實效性的關鍵。
資助政策的不斷完善增加了資助的覆蓋面,而在資助工作過程中的問題也愈發增多,研究者開始對現有的資助模式進行研究,試圖建立更加合理的資助模式。何旭娟等聚焦資助模式與資助育人進行研究,提出“經濟資助+成長扶助”的“雙助”模式,實現資助與育人的深度融合,促進家困生成長成才[8]。李潔基于教育公平理論、教育成本分擔理論和以人為本的理論,對精準資助的政策要求、工作體制、運行機制等進行了深入剖析,從精準識別資助對象、精準確定資助標準、精準保證發放時間、精準動態監督反饋進行研究,從實踐層面探究精準資助的可行路徑[9]。當前傳統資助模式的優化主要局限在理論建構、體制機制上,聚焦實踐層面的資助可行模式或路徑研究還不夠完善。隨著大數據技術的發展,有學者將新技術應用于建立學生資助模式和評價體系上,羅麗琳提出要利用大數據技術的優勢,優化學生資助模式,從框架設計、制度保障、技術路徑和聯動機制等角度出發,構建大數據信息平臺[10];歐陽鐵磊等通過分析校園卡消費數據將學生分為兩類統計消費特征,通過尋找家困生的消費特征,利用相關技術分析學生家庭信息和行為特征,設計辨別家困生的模型,為資助家困生提供數據參考[11]。在此階段,相關研究主要聚焦大數據技術本身,偏重技術而在體系建構上稍顯不足。
傳統的家困生認定模式中,識別家困生的主要依據是高校學生家庭情況調查表和認定申請表,家庭情況調查表由學生本人填寫基本情況、家庭類型、家庭成員、家庭經濟情況等信息,認定申請表由學生本人填寫家庭經濟情況、申請認定理由等信息,之后由班級評定小組評定、二級學院評定,最后交由學校資助管理機構審核。無論是家庭情況調查表還是認定申請表,學校對學生家庭所在地民政部門意見簽章已經不作要求,申請認定家庭經濟困難很大程度上以學生的個人誠信為前提,但學生的申請材料時常存在不同程度的與現實情況不符的成分,實際操作過程中家困生的認定結果在一定程度上與學生的實際家庭經濟情況相偏離。而利用大數據技術中的決策樹算法可以構建以多重數據來源為主體的高校家困生認定決策方法。
決策樹算法的類型有很多種,其中常用的是由羅斯·昆蘭提出的C4.5決策樹算法。它的基本原理是將具有多種特征的數據進行加工整理,輸出具有某一類特征的數據。這種算法可以將不同的數據集進行提煉、整合,給不同數據貼上不同的標簽,而這種不同的標簽就可以為管理者進行決策提供參考。
圖1為決策樹算法精確認定家困生技術生成結構。在實際的運用過程中,導入政府平臺的家困生數據、國家助學貸款銀行數據、學生基礎信息數據等,對缺失值進行處理,對異常值進行檢測,并對隱私數據進行脫敏處理,之后進行數據集成、數據選擇。在這個過程中需要將采集到的數據分類為訓練版本和測試版本,使用訓練版本進行模型訓練,之后利用測試版本進行反復驗證和科學性評估,并對存在的問題進行調整。利用算法將不同維度數據導入處理后,可以給數據貼上不同的標簽,而不同的標簽就指代不同的學生群體,如指代建檔立卡學生、城鄉低保學生、殘疾人家庭學生和殘疾學生、單親學生、遭遇突發事件家庭學生等具有不同標簽的家困生群體,可以快速實現對家困生的分類、分層,并通過決策樹算法對家困生進行有效精準識別和動態管理,實現全過程跟蹤。

圖1 決策樹算法精確認定家困生技術生成結構
目前對家困生的分類主要是基于學生申請表中填寫的家庭經濟情況,而沒有綜合對學生的消費情況、家庭情況等進行整體評估,在綜合評定學生的經濟困難情況時分層不精準,得出的家庭經濟困難、家庭經濟一般困難、家庭經濟不困難的評價結果很大程度上是基于人為主觀因素評定的,這種傳統的分類方法過于主觀,容易導致“偽家困生”“虛假貧困”等現象的產生,而利用大數據技術中的聚類算法,可以實現對家困生群體的主動識別。
就聚類算法而言,其基本原理是對大量的差異化數據進行篩選、清洗,把具有類似特征的數據穩定在不同的屬性周圍,在這個過程中可以提煉差異化數據中具有穩定性質的同類數據。通過聚類算法的多次清洗,最終可以得到幾個穩定的具有突出特征的數據集合,這些集合的產生就是通過聚類算法使數據收斂、歸類的結果。
在實際應用中,K-means算法是常用的聚類算法之一,基本思路是結合高校學生的基礎信息數據和其他在校行為數據分析,其他在校行為數據主要包括成績數據、校園卡消費數據、圖書借閱總數、身體素質測試數據的統計值等[12]。通過聚類算法完成對該樣本的數據處理、挖掘與分析,剔除信息失真數據和嚴重異常的樣本后,對較為精確的數據進行進一步分析和數據脫敏處理,得出學生消費習慣聚類分析、學生生活習慣聚類分析、學生學習習慣聚類分析。通過對這一系列數據的聚類,可以主動挖掘出校園中具有家困生特征的學生群體,輔助家困生基礎信息的評定與分析,實現從“數據端”到“學生端”的主動識別,對學生的整體經濟水平、困難程度進行綜合評估,主動識別家困生,實施精準資助(見圖2)。

圖2 聚類算法主動識別家困生技術生成結構
高校家困生資助工作的執行環節主要在學院完成,學院和學校職能部門之間屬于“審核—審批”的靜態關聯。所有的環節主要在線下完成,包括學生申請、班級評議、輔導員審核、學院審核、學校資助中心審核、學校審批、結果公示、資格復查。構建基于大數據的精準資助體系(見圖3),以家困生基礎信息數據、學生消費數據等為支撐,可將工作方式由線下轉移到線上,形成對家困生入庫認定、助學金評定、家困生動態管理與測評的全過程全方位管理,對傳統的資助形式進行流程變革與優化,進行精準資助體系建構。

圖3 “大數據+精準資助”技術生成結構
基于大數據技術,可依靠收集的家困生基礎數據、學生校園消費數據、圖書館借閱和出入數據、學生成績信息、寢室門禁系統出入數據、生源地貸款數據、家庭經濟情況調查數據等多種維度的家困生信息,建立家困生精準資助的管理系統。結合決策樹算法和聚類算法,可形成家困生精準資助的識別、分類和管理體系。我們根據決策數算法和聚類算法的數據分析與整理,對高校學生的數據進行深度挖掘,進而為構建“大數據+精準資助”的精準資助體系提供數據支撐。
另外,建構家困生精準資助體系的關鍵在于獲取學生在校園產生的數據,因此需要對校園數據和外部數據進行整合和融合,在總體框架上制定學生資助標準、學生數據、學生數據端口接入與管理、學生數據存儲與計算、導入與導出、檢索與分析、動態監測與管理、綜合分析等各個模塊。通過算法對數據進行脫敏處理、特征提取、特征選擇、分析驗證,完成大數據精準資助的技術支撐,進而實現高校學生申請家困生認定、助學金評定、家困生日常行為分析與管理等操作。
最終,家困生精準資助體系的構建可以將傳統的人工審核轉變為結合數據分析的綜合評定,將傳統的被動管理轉變為主動管理,高校管理者可以根據數據呈現的學生特點、動向,對家困生進行精準化資助,實現體系化管理,同時該體系可賦能高校資助工作,給高校管理人員減負,實現數據驅動下的精準資助。