段菊
摘要:扶貧問題一直以來備受關注,隨著大數據技術的發展,數據挖掘技術應用于高校精準扶貧中,但數據分析對象僅限于校園一卡通數據,存在一定的局限性。隨著高校信息化建設的完善升級,移動支付已是遍地開花,因此,數據分析的對象還需要考慮移動支付產生的數據,提出移動支付背景下數據挖掘技術在高校扶貧中的應用研究。對移動支付和校園一卡通數據的綜合分析與挖掘,在一定程度上提高了扶貧的精確度。
關鍵詞:大數據;數據挖掘;移動支付;校園一卡通;精準扶貧
中圖分類號:TP391.4 ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2018)35-0015-02
Abstract:The issue of poverty alleviation has attracted much attention. With the development of big data technology, data mining technology is applied to the precise poverty alleviation of colleges and universities, but the data analysis object is limited to campus card data, which has certain limitations. With the improvement and upgrading of university Information construction, mobile payment has been everywhere. Therefore, the object of data analysis also needs to consider the data generated by mobile payment. This paper proposes the application of data mining technology in poverty alleviation in Colleges and Universities under the background of mobile payment. The comprehensive analysis of mobile payment and campus card data improves the accuracy of poverty alleviation.
Key words: big data;data mining technology;mobile payment;campus card; precise poverty alleviation
1 概述
確定扶貧對象的傳統做法是通過調查走訪、個人申請、學生評議等方式來確定,過程復雜、耗時耗財又耗力,不適合大面積推廣使用,并且存在有些學生自尊心強不愿意自主申請,即使辦理了資助在心理上也覺得自卑,如果可以“隱形資助”在一定程度上可以消除這些學生的顧慮,目前有些高校已經實現[1]。
這些高校無疑是通過借助數據挖掘技術[2],對校園一卡通的海量數據進行分析。數據挖掘[3](Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。校園卡作為學生在校園里的唯一身份認證憑證,記錄了學生就餐、購物、借閱圖書、洗浴等信息,提取校園卡中學生消費的信息、考勤信息等可以用來判定學生的貧困程度。文獻[4]中通過挖掘學生的消費模式、學習模式和生活模式來判斷該生是否為貧困生,再加以實際調研來確定;文獻[5]對校園一卡通數據采用K-means聚類算法,將得到的聚類結果用于計算學生的貧困指數;文獻[6-10]都是通過對一卡通中的數據進行分析,對學生進行貧困生的分類。
可見,通過數據挖掘技術對校園一卡通中的數據進行分析,輔助高校判定貧困生的技術已經相當成熟。隨著學校信息化建設的發展,微信、支付寶支付已經逐漸滲透到學校,在校園內同時存在著一卡通支付、微信支付和支付寶支付,因此,只分析一卡通的數據來判定貧困生的做法,存在嚴重的局限性。
2 移動支付下數據挖掘技術在高校扶貧中的應用
2.1 移動支付在高校校園生活中的應用
目前,無論是微信還是支付寶都為高校免費提供電子一卡通產品,學生可以通過電子一卡通實現支付功能,并且可以用于借閱圖書、門禁等身份驗證。在這之前,學校餐廳僅提供刷卡機刷一卡通服務,學校商店不納入學校財務管理范圍,學生去校園商店購物支付現金或者掃碼支付,但是付款二維碼歸商店所有,學生的消費記錄不會出現在學校的統計范圍內。隨著生活條件的提高或四季天氣的變化,有些學生不去或很少去餐廳就餐而是去商店購買零食,以筆者所在學校為例,商店里面有幾家賣面食的,每次到吃飯的時候,都排很長的隊伍,有些學生在夏天直接買點水果就回宿舍休息了,這些情況,如果僅僅通過對一卡通的數據進行判斷來確定貧困生,就會產生誤差,可能在分析一卡通信息的時候存在同學在餐廳消費金額很小,而導致誤判其家境貧寒,實則是其不經常在餐廳就餐而是購買商店零食或水果等,代替了去餐廳就餐,為了減少這種情況的出現,需要拓寬采集數據來源的渠道。
隨著移動校園的上線推廣使用,移動支付也推廣到了高校,微信、支付寶商家為高校設置校園賬號,為餐廳、校園商店都提供掃碼器,這樣,學生就可以像使用校園一卡通一樣使用電子一卡通實現電子支付,學生的所有消費記錄都會在學校的總賬戶上有記錄,這在一定程度上彌補了數據來源的局限性。
2.2 校園一卡通數據在高校扶貧中的應用
抽取校園一卡通數據庫中某一時間段內的數據,對經過清洗后的數據進行聚類分析、關聯挖掘,提取有用信息應用于貧困生的判定,可以有效地提高貧困生認定的精確度和相關人員的工作效率,圖1就是數據挖掘技術在貧困生認定中的應用模型。
數據挖掘又稱知識發現(KDD:Knowledge Discovery in Database),即“從數據中挖掘知識”,其基本步驟為:
(1) 數據清洗:清除噪音和刪除不一致的數據;
(2) 數據集成:多種數據源組合在一起;
(3) 數據選擇:從數據庫中提取與分析任務相關的數據;
(4) 數據變換:通過匯總或聚集操作,把數據變成和統一成適合挖掘的形式;
(5) 數據挖掘:數據挖掘吸納了諸多領域的大量技術,根據數據功能的類型和數據的特點選擇相應的算法;
(6) 模式評估:根據某種興趣度量值,識別代表知識的真正有趣的模式;
(7) 知識表示:使用可視化和知識表示技術,向用戶提供挖掘的知識。
數據挖掘過程是一個反復循環的過程,每一個步驟如果沒有達到預期目標,都需要回到前面的步驟,重新調整并執行。步驟(1)~(4)又合稱為數據預處理,在數據挖掘的過程中,要花費絕大部分的時間和精力在數據預處理部分。
2.2.1 學生消費數據挖掘分析
學生通過使用校園一卡通和電子校園一卡通,在校園內就餐、購物、打水、洗浴等,挖掘學生每學年的整體消費數據,統計分析學生一個學期內平均在校就餐次數和每餐平均消費金額;在校園超市內消費總額及購買物品的種類;打水、洗浴的消費記錄也至關重要,一般家境貧寒的學生會比較節約用水。通過數據挖掘技術分析學生的家庭經濟狀況,可以作為確定貧困生認定的先決條件,也可以作為認定后的驗證條件。
2.2.2 充值數據分析
通過對比分析充值的次數和每次充值金額,在一定程度上可以看出學生的經濟狀況,一般經濟條件好的學生,每次充值金額會比較大,因為手上資金比較寬裕,不怕遇到意外情況;而經濟條件比較差的學生,更傾向于少量多次的方式,因為一卡通只能充值不能提現,遇到意外情況,經濟損失比較大。因此,通過分析充值數據,在一定程度上可以作為判定貧困的佐證條件。
2.2.3 學習和生活數據分析
貧困生評定的另外一個重要依據就是學生的學業情況,包括出勤率、學業成績、圖書借閱、宿舍門禁數據等,通過對學生學習及生活數據的挖掘分析,可以評定該生的貧困情況,一般家庭貧困的學生能夠按時上課、按時回宿舍休息、成績一般不會很差,如果是貧困生但是存在經常曠課、夜不歸宿等情況,說明該生本身沒有上進心,扶貧意義不大。
3 結論
對校園一卡通中海量數據的信息挖掘,可以為扶貧工作帶來有實用價值的信息。本文提出的移動支付背景下數據挖掘技術在高校扶貧中的應用研究,在高校扶貧中增加對移動支付數據的挖掘,在一定程度上彌補了僅對傳統校園一卡通數據分析的局限性,使貧困生的判定精確度在一定程度上得到了提高。
參考文獻:
[1] 文明珠. 教育信息化背景下校園卡系統數據挖掘的研究與實現[J]. 電腦知識與技術, 2016, 12(5):5-6.
[2] 劉銘, 呂丹, 安永燦. 大數據時代下數據挖掘技術的應用[J]. 科技導報, 2018(9).
[3] 劉世平. 數據挖掘技術及應用[M]. 北京,高等教育出版社,2010,25-26.
[4] 樊搏, 呂艷芝, FanBo,等. 基于一卡通數據中心的貧困生輔助認定分析[J]. 科教文匯, 2015(31):122-123.
[5] 費小丹, 董新科, 張暉. 基于校園一卡通消費數據的高校貧困生分析[J]. 電腦知識與技術, 2014(20):4934-4936.
[6] 張璽, 咼森林, 孫宗良. 基于校園一卡通消費數據對高校貧困生分類的應用研究[J]. 數字技術與應用, 2016(8):100-100.
[7] 張紅蕾. 數據挖掘在校園卡消費中的研究與應用[D]. 蘭州交通大學, 2016.
[8] 吳衛東. 高校校園一卡通消費數據完整性及應用研究[J]. 華中師范大學學報:自科版, 2017(s1):130-133.
[9] 王亞楠. 大數據背景下數據挖掘技術在高校中的應用——以校園卡系統為例[J]. 華中師范大學學報:自科版, 2017(s1):9-12.
[10] 馬洪維. 校園一卡通消費數據的挖掘與分析[D]. 山西師范大學, 2016.
[通聯編輯:王力]