999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于校園一卡通的數據挖掘應用研究

2019-09-26 05:55:36鈕永莉馮勝安賈紅雯
信陽農林學院學報 2019年3期
關鍵詞:數據挖掘學生

鈕永莉,馮勝安,賈紅雯

(滁州職業技術學院 信息工程系,安徽 滁州 239000)

隨著高校信息化建設的發展,校園一卡通系統應運而生并應用于校園管理的各個領域,包括飲食消費、圖書借閱、超市、洗浴、用水用電等。其中,食堂消費數據是最為穩定和準確的,能夠很好地反映出大學生在校的消費行為[1]。 對一卡通數據的挖掘,有助于學生管理和學校的管理決策,如對困難學生和助學金的輔助認定,對學生食堂的智能管理等。

雖然困難學生認定和國家助學金評定體系日益完善,但依然存在一些不盡如人意的地方,如認定過程不夠科學,客觀性不夠等[2]。因為目前學校認定困難學生和發放助學金主要依賴困難家庭調查表和同學評價,考慮到人為因素,有時難免會發生一些不公平現象,造成部分需要受資助的貧困學生未得到資助,而少數不需要資助的學生得到補助。因此,如何更好地完成精準資助就成為亟待解決的問題。使用學生一卡通消費信息的挖掘,可以及時掌握學生在校消費情況,為貧困生認定和助學金發放提供輔助決策。

1 數據挖掘

數據挖掘(Data mining)是一門新興的交叉學科,是指從大量的、有噪聲的、模糊的數據中通過算法提取隱含在其中的信息的過程。按照挖掘的知識類型分類,數據挖掘可分為特征規則挖掘、聚類規則挖掘、關聯規則挖掘等。對于校園一卡通數據,使用聚類挖掘方法較為適合。數據挖掘的基本過程通常包括定義目標、數據收集、數據預處理(數據清洗-去掉臟數據、數據集成-集中、數據變換-規范化、數據規約-精簡)、挖掘建模(分類、聚類、關聯、預測)、模型評價與發布等[3]。

2 聚類分析

聚類分析作為數據挖掘技術中的重要方法,是一個無監督的學習過程,聚類方法有很多,其中模糊聚類是將模糊數學和聚類方法相結合的算法,被廣泛使用在社會生活的各個領域,特別適用于具有模糊特征的數據分類中。對校園一卡通數據的使用刷卡次數和刷卡金額等屬性進行分類時具有明顯的模糊特性,即數據對象的亦此亦彼的特點,因此我們使用模糊聚類方法對學生樣本進行分類。模糊聚類中最經典的是模糊C均值算法(FCM),但傳統的FCM算法有對噪聲數據敏感且易陷入局部極小值缺點[4]。因此,本文對FCM算法進行改進,使之更加適合校園一卡通這類樣本量較大的數據挖掘問題。

2.1 FCM算法

模糊C均值(FCM)算法是在普通聚類的基礎上,由Dunn提出并由J.C.Bezdek推廣發展的一種聚類算法,它通過優化目標函數得到每個樣本點對所有類中心的隸屬度,從而決定樣本點的歸類[5-6]。假設一個給定的樣本集合為X={xi,i=1,2Λn},n為樣本總數,xi為k維向量,將樣本集X劃分為c×n的矩陣U={μij},μij是第j個樣本對第i類的隸屬度。

(1)

(2)

假設V={vi}是聚類中心,其計算方法如下:

(3)

其中,dij=‖xj-vi‖為樣本與聚類中心之間的距離,一般為歐式距離;m為模糊加權指數,且m>1,用來控制分類矩陣U的模糊程度。

(4)

FCM算法采用誤差平方和函數J(u,v)作為目標函數,通過式(2)和式(3)的迭代計算隸屬度矩陣U和聚類中心V,使目標函數J(u,v)的差值不斷減少直至達到一個事先約定的誤差ε,則循環停止,獲得最終的隸屬度矩陣和聚類中心,即聚類結果。

2.2 改進的FCM算法(DWFCM)

(5)

為使該目標函數達到最小值,構造拉格朗日函數如下:

(6)

公式(7)

2.2.2 算法步驟 改進后的算法(DWFCM)其主要步驟為:

步驟1:參數初始化,包括類別數c,參數m,迭代終止條件(最大循環次數K,允許誤差ε),初始聚類中心等[7];

步驟3:用值在[0,1]之間的隨機數初始化隸屬度矩陣U并滿足公式(2);

步驟4:根據公式(7)計算聚類中心vi;

步驟5:根據公式(5)計算目標函數的差值;此時如果差值小于事先給定的誤差值ε或迭代次數大于K,則結束循環;

步驟6:否則根據公式(1)計算出新的隸屬度矩陣,并轉步驟4。

3 一卡通數據應用

本文的數據挖掘處理過程如圖1所示:先獲取學校的一卡通消費數據,再進行數據預處理,然后使用改進的FCM算法(DWFCM)進行聚類,最后結合學校的困難學生認定政策,給出困難學生參考名單,為助學金和其他獎金發放提供理論支持。

圖1一卡通數據挖掘與分析過程

3.1 數據獲取

本文數據采集于我校校園一卡通系統數據庫,包括新校區所有在校學生的一卡通消費信息,時間:2017.9.1~2018.6.30。因涉及到學生隱私問題,因此只采集并保留數據挖掘所需的必要字段,如學生的學號、所在系、專業、刷卡日期、刷卡時間、刷卡地點、刷卡金額、圈存信息等。

3.2 對學生消費數據的預處理

原始提取的信息可能存在噪聲、冗余等,因此要進行后續的分析和挖掘工作就必須對數據進行預處理。數據預處理的方法主要包括數據清洗、數據集成、數據變換和數據規約等。

3.2.1 數據清洗 數據清理的方法主要包括對缺失值的處理、噪聲數據的處理等。首先一卡通中包含了教職工、學生等各種人員的數據,應只保留學生數據;對于服兵役、休學、退學、開除等原因引起的缺失數據樣本也應刪除;而一卡通消費中的開水消費和洗浴消費由于對困難家庭認定意義不大,因此也一并去除。因學校助學金發放是按照不同年級遵循一定比例,因此我們以2017級學生為例進行研究,可以為2018-2019學年的困難學生認定和發放國家助學金提供輔助意見。其他年級方法相同。

3.2.2 數據集成 不同系統或數據表中的數據應根據需要進行集成,保持數據格式和內容的一致性[8]。由于本文用到的數據來源于不同的數據庫表,因此需要將不同數據表的數據整合到一起,方便研究。如消費表中只有學工號而非學號,因此需要在學號表中找到學工號和學生真實學號的對應關系,便于將聚類結果對應到學生學號。

3.2.3 數據變換 為了提高挖掘的效率和維度,讓數據分析更容易實現,對學生消費記錄中的就餐時間格式進行分析后拆分,使之轉換為刷卡的月份、日期、時間等詳細屬性。

3.2.4 數據規約 針對本次數據挖掘的目標,對那些與挖掘目標無相關性或弱關聯的屬性,應選擇放棄,如學生的身份證號、電話、家庭住址以及卡號、余額等。由于數據庫中的消費數據是每次刷卡記錄,為了更加貼近學生的真實消費水平,本文對學生的月均消費情況進行挖掘分析。根據數據變換的結果整理出每位學生的總刷卡次數和總的消費金額,根據學生的在校情況,用均值方式得出月均刷卡數和月均消費額,從而大大縮小數據量,提高挖掘的效率。

通過以上數據預處理過程,可以使待挖掘的數據合乎規范且精簡,為以后的數據分析和挖掘建模奠定良好的數據基礎。

4 挖掘建模及決策建議

為研究學生在校消費水平,本文使用FCM和改進的FCM算法(DWFCM)分別對數據進行聚類并進行比較,數據集包括的屬性有學號、月均消費金額和月均刷卡次數。實驗軟件采用Python3.7,編程環境是PyCharm 2018.3.4 Community Edition。參數設置為:模糊指數m=2.0, =0.0001,最大迭代次數K=50,分別取分類c=3,4,5進行多次試驗,對得到的聚類結果進行比較發現:當分為5類時,能更好的區分兩類極端群體,因此類別取5類。FCM算法對初值的依賴很強,當初值選定不理想時,可能會導致聚類效果不佳,得到的最終聚類中心與實際有一定差距。而DWFCM算法使得密集區域內的樣本點權重高于稀疏區域的樣本點,并更新了目標函數,這樣不但有利于找到更合適的聚類中心,還可加快聚類中心迭代的速度,取得更好的聚類效果,優化算法的性能。

FCM算法和DWFCM算法的聚類中心和分類結果分別如圖2和圖3所示。當學生的月刷卡數較高且月消費額較低時,屬于困難家庭學生的幾率比較大。圖2的五個聚類均不符合這一要求,而圖3中的第0個聚類應屬困難家庭學生簇;其聚類中心為(82.2393,401.2936),即月刷卡次數82次,月消費額401元,符合上述特點;且23.4%的比率也較為符合我校助學金發放現狀。對這些學生在進行困難家庭認定時應著重注意,避免漏選;而對于那些雖然有困難家庭調查表但在校消費較高的同學(第4簇)也應著重調查,避免錯選。

圖2 FCM算法聚類中心與結果 圖3 DWFCM算法聚類中心與結果

由圖可見,改進后的DWFCM算法無論是聚類中心還是聚類結果都比FCM算法更優,更符合學校困難學生認定現狀。將該模型與學校現有的貧困生認定方法相結合,可以提高貧困生認定覆蓋率,最終達到精準資助的目的。

5 結語

本文針對一卡通食堂消費數據挖掘提出了一種改進的模糊C均值算法(DWFCM算法),可以為貧困生認定和助學金發放提供客觀數據支持。依據一卡通食堂消費數據,還可以研究消費高峰期與食堂開放窗口數量的關系,從而及時調整食堂管理措施。除此之外,一卡通系統中包含的用水信息、洗澡信息等還有助于學校的水房管理、浴室管理,這些都有待于今后進一步的研究。

猜你喜歡
數據挖掘學生
快把我哥帶走
探討人工智能與數據挖掘發展趨勢
《李學生》定檔8月28日
電影(2018年9期)2018-11-14 06:57:21
趕不走的學生
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
學生寫話
數據挖掘技術在中醫診療數據分析中的應用
學生寫的話
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 亚洲男人的天堂久久香蕉网| 成人亚洲国产| 欧美天堂在线| 国产区人妖精品人妖精品视频| 夜夜拍夜夜爽| 人妻丰满熟妇αv无码| a毛片在线播放| 谁有在线观看日韩亚洲最新视频| 免费在线看黄网址| 亚洲日本韩在线观看| 国产精女同一区二区三区久| 毛片免费高清免费| 国产精品视屏| 亚洲天堂日本| 亚洲美女一区二区三区| 国产成人成人一区二区| 99视频精品全国免费品| 亚洲人成网站在线播放2019| 亚洲欧美日韩精品专区| 国产v欧美v日韩v综合精品| 人妻无码AⅤ中文字| 青青久视频| 国产视频大全| 久久人妻xunleige无码| 久久亚洲国产一区二区| 99久久精品国产自免费| 欧美va亚洲va香蕉在线| 99精品一区二区免费视频| 2022国产91精品久久久久久| 99精品福利视频| 日韩av手机在线| 亚洲综合激情另类专区| 97久久超碰极品视觉盛宴| 无码精品国产dvd在线观看9久| 亚洲色欲色欲www在线观看| 亚洲国产欧美中日韩成人综合视频| 亚洲美女一级毛片| 色综合狠狠操| 无码综合天天久久综合网| 永久免费av网站可以直接看的 | 欧美一区二区三区欧美日韩亚洲| 精品无码一区二区在线观看| 亚洲一级色| 欲色天天综合网| 日本高清免费不卡视频| 不卡无码网| 亚洲精品福利网站| 亚洲中文字幕久久无码精品A| 97视频在线精品国自产拍| 国产成a人片在线播放| 国产99精品视频| 手机在线免费不卡一区二| 狠狠干综合| 东京热av无码电影一区二区| 国产精品亚洲一区二区三区在线观看| 精品夜恋影院亚洲欧洲| 日韩中文无码av超清| 久久精品娱乐亚洲领先| 九九精品在线观看| 亚洲中文字幕在线一区播放| 欧美啪啪网| 国产毛片一区| 国产麻豆永久视频| 67194亚洲无码| 欧美色图久久| www.精品视频| 国产一区亚洲一区| 高清不卡毛片| 久久精品国产国语对白| 亚洲日韩精品欧美中文字幕| 四虎亚洲国产成人久久精品| 91久久精品国产| 一级毛片a女人刺激视频免费| 亚洲最黄视频| 亚洲欧美不卡中文字幕| 亚洲三级电影在线播放| 久久久久无码国产精品不卡| 亚洲精品777| 午夜在线不卡| 波多野结衣爽到高潮漏水大喷| 国产一区二区网站| 日本福利视频网站|