鄭麗波 師東菊 相悅麗



摘 ?要: 應用大數據、聚類算法等技術實現高校貧困生認定與管理系統云平臺的設計,有利于高校扶貧工作的精準化、理性化、科學化。采用HDFS架構的高校貧困生認定與管理系統云平臺,技術難度較低,數據處理效率較高。
關鍵詞: 大數據;貧困生;系統
中圖分類號: TP391.4 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.08.011
本文著錄格式:鄭麗波,師東菊,相悅麗,等. 高校貧困生認定與管理信息系統云平臺的設計與實現——以牡丹江醫學院為例[J]. 軟件,2020,41(08):37-39
【Abstract】: The application of big data, clustering algorithm and other technologies to realize the design of the cloud platform for the identification and management system of poor students in Colleges and universities is conducive to the accuracy, rationalization and scientization of poverty alleviation work in Colleges and universities. The cloud platform of the identification and management system for poor students in Colleges and Universities Based on HDFS architecture has low technical difficulty and high data processing efficiency.
【Key words】: Big data; Poor students; System
0 ?引言
黨的19大強調指出要健全學生資助制度,教育部2017年的《高校思想政治工作質量提升工程實施綱要》指出要構建資助育人等育人體系,提升高校思想政治教育的工作質量,意味著高校資助工作已不單純的是服務保障和經濟資助[1]。在對貧困大學生進行資助的過程中,貧困生身份認定、資助金額等對貧困生資助工作的效率與質量會產生重要的影響。精準資助的模式下的高校貧困生資助工作需要達到對象精準、資助力度精準、名額與資金分配精準以及發放精準四點要求[2]。
將大數據資源與處理技術應用于高校貧困生精準模式種,能夠為精準資助對象、力度及名額的確定提供有效的前提,基于大數據的高校貧困生認定與管理信息系統,能夠使資助資源系統化,通過大數據分析方法對扶貧數據進行資源系統化,通過大數據分析理念與方法對扶貧數據進行整合分析,對相關人員信息進行規范化與系統化處理,能夠提升扶貧數據的動態性、智能性、利用數據信息平臺,能夠使精細化監管的目的,打破扶貧監管工作的時間與空間限制[3]。
2015年8月,國家教育部出臺《國家學生資助政策體系簡介》,該簡介指出,黨和政府高度重視家庭經濟困難學生。近些年,各級政府部門相繼出臺相關資助政策[4]。根據教育部調查結果顯示:目前我國高校存在經濟困難的學生占在校學生的15%-20%,而且,每年也有因家庭困難而選擇退學的學生。社會對高校貧困生現象高度關注。高校貧困生的資助工作已稱為當前的高校扶貧領域的重要內容[5]。然而,由于高校貧困生的認定工作由于各個學校的認定方式不盡相同,資助的效果也產生較大差異。貧困生的精準認定模式仍需要進一步改進。高校對貧困生的認定方法必須要與時俱進。本文結合牡丹江醫學院的實際提出一種貧困生的認定與管理信息系統[6]。
1 ?相關技術
基于當前高校貧困生認定工作的現狀,調研結果顯示目前我國高校貧困生認定工作存在一定的問題:(1)貧困生工作人為因素較多;(2)高校貧困生的相關數據量極大;(3)高校貧困生的數據挖掘方式有待提高[7]?;谏鲜鰡栴},本文依托高校貧困生,選取合適的算法對貧困生的進行評估分析,進而對貧困生認定提供決策。因此,本研究采用Hadoop數據平臺進行大數據處理[8]。
1.1 ?Hadoop分布技術
隨著信息技術的快速發展,Hadoop平臺的海量數據分析技術已經得到廣泛的應用。該平臺具有開源,成本低的優點。其框架為HDFS(Hadoop Distributed File System)分布式文件系統與MapReduce并行計算模型[9]。HDFS提高容錯性的基礎為:分布式管理、存儲數據,即將大數據文件進行文件分片存儲在不同集群節點上,并在不同機器節點上進行備份。HDFS系統采用M/S的架構(即Master/Slave)的架構來存儲數據,由一個管理節點NameNode(Master)和多個數據節點DataNode(Slave)共同組成,NameNode管理節點負責管理HDFS的運行,維護整個系統中的元數據,處理客戶端的讀寫請求。DataNode用于存儲數據,可讀寫不可更改[11]。MapReduce主要用于大規模的數據采集的運算,其核心思想為:分散數據操作于在主節點的管理下對每個節點進行分發,然后進行整合,獲取最終的結果。MapReduce的核心操作為Map和Reduce兩部分組成,Map用于數據分割、整理。Reduce進行并行計算,對結果進行匯總。Hadoop組件如圖1所示[12]。
1.2 ?HDFS系統架構
HDFS的主要作用為存儲數據,HDFS的架構設計較為安全,在一般情況下,DataNode負責備份數據塊,目的在于即使DataNode節點出現故障,即使不能訪問該故障的Data-Node,還可以使用其他的節點。當客戶端client需要進行HDFS寫操作時,客戶端首先調用NameNode[13]。
1.3 ?Hive數據倉庫
Hive作為Hadoop集群中一個數據倉庫,功能強大,可以將結構化的數據文件轉換為可以使用的SQL查詢的數據表。Hive的查詢語句十分簡單,與SQL查詢語句想類似。Hive允許自行定義Mapper和Reducer來處理數據[13]。
1.4 ?數據挖掘算法
數據挖掘算法采用聚類算法,即基于事務外在的特征,經過相似度計算,時的具有較高相似的對象劃分到一類,以分析出同一類別共性與不同類別之間的差異性問題,以便于進一步數據挖掘。聚類算法的種類主要事基于層次的聚類和基于劃分的聚類、基于密度的聚類、基于網格的聚類、基于模型的聚類。本貧困生認定與管理系統采用基于劃分的聚類算法(K-means),適用于大數據運算[14]。
2 ?貧困生認定與管理系統的數據統計分析
為真實的分析判斷學生在校園網絡和學校食堂的消費數據,需了解下學生在校的實際情況,通過分析學生在校行為,判定學生的貧困生的程度。通過統計學分析,應用K-means算法調參、調優等操作,進行數據的模型訓練和判斷。
本研究使用的數據來源于牡丹江醫學院2018年9月-2019年12月學生食堂消費記錄和學生校內超市、洗浴、圖書館門禁及借閱記錄,充值記錄。其中以食堂消費記錄為主。如表1所示,學生食堂飯卡消費記錄中包括學號、消費時間、消費金額、消費地點[15]。
2.1 ?學生消費數據預處理
學生在學校食堂的消費記錄包括了學生的消費時間、消費地點、消費金額。學生的食堂消費情況可以反映出學生的消費能力[17]。對貧困生的認定提供借鑒和參考。消費記錄分析包括月每天刷卡消費金額分析、日各時段刷卡頻率分析,通過對學生的消費行為進行數據聚類算法分析,貧困生認定人員可挖掘貧困生在校消費習慣[18]。在使用算法對數據進行數據挖掘之前,需對數據缺失、有噪聲數據進行整理即對缺失值、噪聲數據進行去除工作[19]。缺失值除了方法為刪除數據、均值填充、插補數據、異常值處理即遠離正常值范圍的數據點(“離散點”)。例如學生在食堂一次性花費100元,該學生的消費出現異常,此時應該以其他的消費記錄填充情況進行缺失值處理填充本次消費。
本實驗研究基于高校學生的數據,為了便于聚類分析,需要將學生的數據進行離散化,按照數據進行等寬劃分。
2.2 ?原始數據離散化
學生食堂消費數據按照等寬劃分為五個區間,即很高、高、中、低、很低來劃分[21]。每餐消費在10元以下為很低、每餐消費在10-20元為低,20元-30元為中,30-40為高,40元以上為很高[22]。按照此分類,將學生的消費等級離散化,應用聚類質量對比實驗,提取特征值,通過隨機抽樣和輪廓系數來驗證。在不同K值下進行實驗,調參、調優的方式取最優的聚類結果進行對比[22]。
3 ?結果與討論
為實現高校的精準扶貧,提高育人實效,本貧困生認定與管理系統的設計與實現涵蓋了高校學生食堂、校園等消費情況,并結合醫學院校的實際,用學生的消費“數據”作為貧困生認定的標準、參考,使國家助學金等資助體系更精準的落實,使學生工作人員高校貧困生認定工作更理性。同時,大數據的數據分析,也有助于在信息化背景下,開創思想政治教育的與時俱進和科學化、理性化。大數據的運用將成為今后高校學生資助工作的重要手段,基于大數據的高校貧困生認定對切實提高育人成效、客觀、完善高校資助育人體系、落實教育精準扶貧政策有著重要的意義[23]。運用大數據的整理和聚類分析,解決了當前貧困生認定工作的主觀化的問題,并通過大數據的手段提高認定的準確性,確保國家的貧困生資助政策落到實處,維護貧困生的合法權益[22]。對高校而言,基于大數據的高校貧困生認定與管理信息系統云平臺,有利于完善高校資助育人體系,突出了多種育人導向。同時建立了貧困生的數據庫,進行動態管理,對完善整個資助育人體系有著重要的作用[24]。基于大數據的貧困生認定與管理系統,有利于實現高校學生的減貧、社會的公平,同時為高校學生的思想政治教育創新了途徑,體現了黨和政府對高校貧困生扶貧工作的重視,也充分體現了高校學生管理的優勢。
參考文獻
[1] 張維佳, 馬英. 高校貧困生精準扶貧檔案的構建[J]. 蘭臺世界. 2018(06): 113-115.
[2] 周瓊, 李海山. 我國高校貧困生資助體系的現狀及反思[J]. 文教資料. 2006(11): 190.
[3] 韓俊江, 郭暉艷. 我國高校貧困大學生救助政策探析[J]. 教育理論與實踐. 2012(22): 37-40.
[4] 魏立恭, 羅國瑋. 高校貧困生資助系統的研究與實現[J]. 廣西師范學院學報(自然科學版). 2011(03): 29-30.
[5] 畢鶴霞. 中國高校貧困生判別方法及其認同度的實證研究[J]. 高教探索. 2011(04): 115-117
[6] 趙麗榮, 高健. 關于高校貧困生扶貧措施的現狀分析及對策研究[J]. 中國成人教育. 2009(16): 66-68.
[7] 楊晴. 高校貧困生認定的路徑[J]. 教育學術月刊. 2009(08): 15-18.
[8] 畢鶴霞. 國內外高校貧困生認定與研究述評[J]. 比較教育研究. 2009(01): 18-20.
[9] 趙炳起. 高校貧困生認定機制——優化與重構[J]. 教育財會研究. 2006(04): 18-22.
[10] 陳靚, 張少明, 谷磊磊, 等. 大數據在高校貧困生認定工作中的應用[J]. 理論觀察. 2018(08): 32-35.
[11] 陳雅麗. 談高校家庭經濟困難學生認定工作的優化策略[J]. 知識經濟. 2018(14): 112-113.
[12] 趙麗莎. 高校家庭經濟困難學生認定工作中的問題及對策[J]. 赤峰學院學報(自然科學版). 2015(13): 11-14.
[13] 莫光輝. 大數據在精準扶貧過程中的應用及實踐創新[J]. 求實. 2016(10): 12-13.
[14] 劉玉霞. 大數據背景下高校精準資助路徑探析[J]. 未來與發展. 2016(09): 5-8.
[15] 蘭嬡, 沈針, 徐力勇, 等. 新常態下高校貧困生資助工作的思考[J]. 西部皮革. 2016(22): 8-10.
[16] 習近平. 決勝全面建成小康社會奪取新時代中國特色社會主義偉大勝利——在中國共產黨第十九次全國代表大會上的報告[M]. 北京: 人民出版社, 2017.
[17] 羅麗琳. 大數據視域下高校進準資助模式構建研究[J]. 教育研究, 2018, 24(2): 197-204.
[18] 林于良, 丁一嵐. 大數據提升高校精準資助成效的路徑分析[J]. 黑河學刊, 2017, 234(6): 186-188.
[19] 劉玉霞. 大數據背景下高校精準資助路徑探析[J]. 未來與發展, 2016(09): 69-73 .
[20] 凌云. 用大數據思維解決高校貧困生精準化資助問題[J]. 創新創業教育, 2017(06): 128-131.
[21] 張福友. 關于普通高校學生精準資助工作的理路[J]. 黑龍江高教研究, 2015(11): 78-80
[22] 張遠航. 論高校家庭經濟困難學生的“精準資助”[J]. 思想理論教育, 2016(01): 108-111.
[23] 余亮, 陳時見, 趙彤. 大數據背景下數字教育資源服務的內涵、特征和模式[J]. 電化教育研究, 2017, 18(4): 66-71.
[24] 莫光輝. 大數據在精準扶貧過程中的應用及實踐創新[J]. 求實, 2016, 15(10): 87-96.