999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于校園卡學生消費行為的分析與研究

2020-11-13 03:38:57張亮
微型電腦應用 2020年10期
關鍵詞:數據挖掘

摘要:以校園一考通系統為依托,對學生消費數據記錄開展分析和研究。首先對學生基礎消費進行數據處理,通過數據清洗和集成,完成歸約,然后再利用Kmeans算法對學生消費行為聚類分析,分析系統內數據的隱含特征規律,為今后的貧困生資助管理工作中進行數據分析與輔助決策有一定的指導意義。

關鍵詞:數據挖掘;Kmeans算法;消費記錄;校園卡

中圖分類號:TP301

文獻標志碼:A

ResearchandAnalysisofStudentConsumingBehavior

BasedonCampusCardsofStudents

ZHANGLiang

NetworkInformationCenter,ChinaUniversityofPetroleum(EastChina),Qingdao266500,China

Abstract:Thepaperresearchesstudentconsumptiondatabasedoncampuscards.Consumptionrecordsarepreprocessed,includingdatacleaning,dataintegrationandtransformation,datareduction.ThroughtheKmeanscluster,studentconsumptionbehaviorsareanalyzed,andthehiddencharacteristicsofdatainthesystemarediscovered.Thepaperhasimportantguidingsignificancefordataanalysisandauxiliarydecisionmakingofthesepoorstudents.

Keywords:datamining;Kmeansalgorithm;consumptionrecords;campuscard

0引言

隨著大型數據庫的技術成熟以及普及應用,數據挖掘是當前學術界的熱點話題。近年來,基于卡片應用的校園一卡通[13](以下簡稱校園卡)系統的得到快速的發展,并廣泛應用于各大高校,生成了的大量的信息數據,用戶的用卡痕跡通過這些數據被記錄下來,用戶的行為習慣可以通過分析這些數據被反映出來。

在各高校,國家每年通過勤工儉學崗位、貧困生補助等方式,為困難學生提供大量的助學金、貸款和工作崗位。由于認定涉及到多方面的無法衡量的因素,學校僅僅通過學生提交的相關貧困證明等非量化方式進行判定,貧困生的鑒別在各高校都是一個難題。如果鑒別不準確,會造成國家資助工作不到位,教育資源分配出現偏差。通過數據分析算法,對大學生校內消費記錄進行整理、分類、預測,從而整體反應學生在校消費情況,形成量化的評判標準,為今后的貧困生資助管理工作提供可靠的數據支持,輔助完成貧困生的相關工作。

1校園卡消費數據預處理

在進行數據挖掘或者數據分析之前,需要對“臟數據”數據進行數據預處理,一般采用數據清理、數據集成、數據變換、數據規約等方式[46],已獲得更高的挖掘效率和更好的挖掘效果。

1.1數據清洗

最初獲得的原始數據往往存在很多冗余、含噪聲、不一致或者不完整的數據,也就是常說的“臟數據”,因此需要對數據進行清洗。數據預處理主要去處可忽略的字段、忽略空缺記錄、可處理噪聲的數據、可刪除的數據等。由于部分校園卡用戶,如教職工、研究生等,消費時具有很強的隨機性和離散型,因此,本文選取計算機科學與技術專業在校本科生2017年6月1日2019年6月1日兩年的校園卡消費流水記錄作為樣本。結合校園卡系統的后臺數據庫表導出校園卡消費數據表,表中包含的字段有學號、姓名、卡號、專業、余額、交易額、交易時間、對方帳號、POS號,系統代碼。為了保護隱私,對部分屬性做了脫敏和隱私處理。

通過對數據進行分析,由于一些學生休學、退學、服兵役、開出等原因,這些數據的清理對不會對整體造成影響。經過預處理,一共得到227538條有效數據。

1.2數據集成和變換

預處理后的數據不一定適合數據挖掘的使用,因此需要對數據進行集成和變換,以便能夠直接為數據挖掘所使用。本文研究數據主要涉及教務系統數據庫和校園卡消費流水數據庫,因此需要將兩個數據庫中提取出的數據項整合到一起,組成新的數據集環境,并經過詳細對比和篩選解決數據不一致和數據冗余等問題。

本文對數據變換主要側重對消費總金額進行離散化處理,把來自不同源的數據統一為標準格式,進行數據泛化,將不同的消費記錄對應相當的等級。例如將消費記錄日期格式轉換成數值型的日期格式。

1.3數據歸約

數據歸約是指將數據庫中的海量數據進行歸約,本文是對校園卡的消費數據進行數據歸約。通過分析,數據存儲表中很多屬性與本文的研究沒有關聯,可以通過刪除與挖掘目標不相關的屬性減少數據量,還有一些屬性可以被少量屬性替代。數據歸約前后的對比,如表1、表2所示。

2核心算法

2.1基于Kmeans的聚類分析

Kmeans聚類算法一種動態硬聚類算法,是一種基于靜態數據對象間相似度的,以實現類間獨立、類內緊湊的目的。本節將使用Kmeans算法進行聚類分析[78],聚類結果受到隨機選取初始聚類中心點的影響,有可能導致出現局部最小的情況,因此本文通過加權兩個數據點間的歐式距離,來衡量數據點的相似性,初始聚類中心通過目標價值函數的大小排序得到,聚類算法的具體過程如下:

(1)聚類初始中心數據點有系統隨機選擇選定

數目k′(k′>k)個;

(2)讀取并各自計算數據集中的其余數據點與k′個初始聚類中心的賦權歐式距離,按照距離的不同從大的開始排列,把距離最小值點分割到相應類別;

(3)對k′個類別的賦權目標價值函數值δi進行計算,δi值按照越來越大的層級排序,取前k個δi值對應的聚類中心歸納為初始聚類中心;

(4)依據最小相似度的原則,將每個對象與這k個對象進行相似度的比較,并分別分配到以這k個對象為中心所代表的類中;

(5)采用算法選取非中心點Orand;

(6)用Orand作為Ok替換,形成總代價S;

(7)對于每個類,假如,S<0,用Ok被Orand代替,該類的中心在進行重新計算;

(8)依照步驟(4)(5)的迭代N次,若收斂或中心點數據一致無波動,結束過程;

(9)聚類算法結束,獲得最終模型,明確聚類中心。

開始時規定準則函數、迭代次數,考慮算法的成本,迭代次數等于5。為了判斷函數收斂性,確定準則函數為均方差方法,作以下規定如式(1)。

E=∑ki=1∑x∈Cix-x2

(1)

其中誤差總和做平均即是E,x是已知的對象。x是類Ci的平均值。

3數據分析

本文將利用Kmeans算法對消費總金額進行聚集[910],通過5次的迭代聚類3個簇的聚類結果,如圖1所示。

依據消費金額以年為單位將學生聚集為三類,即高消費、中等消費、低消費,此時得到的聚類中心為586.32、372.75、203.65。

根據聚類效果圖繪制圓餅圖,如圖2所示。

依據Kmeans算法分析的結果,可以將所有樣本分成三簇,具體分布如表3所示。

根據對計算機科學與技術專業2016級本科生校園卡聚類情況進行分析,可以得出處于低消費水平的學生占29%。

依據校園卡的學生消費水平的分析情況,學院老師可以了解一些低消費水平學生的情況,在發放助學貸款、助學金或者申請勤工儉學等助學崗位時給予優選考慮。

4總結

本文完成了計算機科學與技術專業本科生的刷卡消費數據進行挖掘的初步探索,首先對校園卡中的消費記錄進行預處理,包括數據清洗、數據集成和變換、數據歸約,然后再利用Kmeans算法對學生消費行為聚類分析,分析系統內數據的隱含特征規律,依據學生的消費水平為學院貧困生量化評定與資助、貧困等級的界限劃分提供科學的、可靠的數據支持。

參考文獻

[1]

劉志宏,喻曉旭.基于數據挖掘的校園一卡通消費行為分析[J].信息記錄材料,2018,19(12):8990.

[2]陳鋒.基于校園一卡通系統的高校用戶就餐消費行為分析與數據挖掘[J].中國教育信息化,2014(9):4749.

[3]ADutt,MAIsmail,THerawan.Asystematicreviewoneducationdatamining[J].IEEEAccess,2017,5(99):1599116005.

[4]紀系禹,韓秋明,李微,等.數據挖掘技術應用實例[M].北京:機械工業出版社,2009.

[5]胡秀.數據挖掘中數據預處理的研究[J].赤峰學院學報(自然科學版),2015,31(3):56.

[6]于琦.Web日志挖掘中的數據預處理研究[J].河南科技,2018(7):1820.

[7]陳艷紅.高校信息系統中的數據挖掘與學生行為預警分析研究[D].武漢:湖北民族大學,2019:2930.

[8]張亮,趙娜.高校新生社團推薦系統的開發及設計[J].計算技術與自動化,2016,35(2):8184.

[9]郭鵬.基于校園一卡通數據的學生消費行為與成績的關聯性研究[D].西安:西北農林科技大學,2019:3134.

[10]張四海,李珊珊.校園一卡通消費行為數據分析與研究[J].北京聯合大學學報,2019,33(1):4749.

(收稿日期:2020.01.20)

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 午夜少妇精品视频小电影| 日韩欧美综合在线制服| 亚洲免费毛片| 毛片在线播放a| 91在线精品麻豆欧美在线| 99久久精品视香蕉蕉| av天堂最新版在线| 国产爽爽视频| 老司机精品一区在线视频| 国内精品伊人久久久久7777人| www.国产福利| 欧美午夜一区| 欧美A级V片在线观看| 国产sm重味一区二区三区| 伊人色综合久久天天| 在线国产综合一区二区三区| 久久久亚洲色| 亚洲天堂日韩在线| 3344在线观看无码| 亚洲国产成人久久精品软件| 国产精品女在线观看| 国产精品hd在线播放| 亚洲综合色婷婷| 福利在线免费视频| 91视频首页| 国产精品xxx| 99久久99视频| 久操中文在线| 97视频免费看| 欧美特级AAAAAA视频免费观看| 欧美黄色网站在线看| 国产精品视频3p| 国产高清精品在线91| 亚洲大学生视频在线播放 | jizz国产在线| 亚洲一区二区在线无码| 国产精品福利一区二区久久| 亚洲国产日韩欧美在线| 精品国产毛片| 日韩国产欧美精品在线| 精品国产99久久| 亚洲无码四虎黄色网站| 欧美国产中文| 亚洲精品视频免费看| …亚洲 欧洲 另类 春色| 国产av剧情无码精品色午夜| 国产精品三区四区| 亚洲欧美成人影院| a级免费视频| 草草影院国产第一页| 国产黄在线免费观看| 精品91自产拍在线| 国产欧美日韩18| 91美女视频在线观看| 一本无码在线观看| 亚洲国产成熟视频在线多多| www.精品视频| 激情成人综合网| 任我操在线视频| 亚洲中文在线视频| 欧美一级大片在线观看| 免费无码又爽又黄又刺激网站| 一区二区三区四区精品视频| 国产一国产一有一级毛片视频| 波多野结衣第一页| 精品国产99久久| 亚洲三级视频在线观看| 久热中文字幕在线观看| 久久黄色视频影| 在线不卡免费视频| 国产一区二区网站| 手机在线免费毛片| 国产情精品嫩草影院88av| 日韩精品一区二区深田咏美| 色九九视频| 国产精品视频第一专区| 亚洲首页在线观看| 亚洲综合国产一区二区三区| 激情无码字幕综合| 真人免费一级毛片一区二区| 亚洲天堂在线免费| aⅴ免费在线观看|