999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RapidMiner的校園一卡通數據挖掘與預測

2021-11-28 10:51:40劉文開焦飛
電腦知識與技術 2021年28期
關鍵詞:數據挖掘

劉文開 焦飛

摘要:為從師生消費行為數據中找出有價值的信息,該文把某高校的校園一卡通中的交易筆數作為研究對象,使用RapidMiner工具進行數據挖掘。對原始數據預處理、選擇合適的模型并進行評估,挖掘出師生食堂消費行為的規律,并預測未來交易總量。預測的準確率較高,相對誤差達到可接受的區間。高校管理者可以運用這些信息進行科學、高效的管理,從而讓管理水平得到一定的突破。

關鍵詞:校園一卡通;RapidMiner;食堂;預測;數據挖掘

中圖分類號:TP391? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)28-0034-03

開放科學(資源服務)標識碼(OSID):

Data Mining and Forecast of Campus One-card Based on RapidMiner

LIU Wen-kai, JIAO Fei

(Zhaoqing University, Zhaoqing 526061, China)

Abstract: In order to find out valuable information from the consumption behavior data of teachers and students, this paper takes the campus one-card transaction data of a university as the research object, and uses RapidMiner tool for data mining. The original data is preprocessed at first and the appropriate model is chosen and evaluated. The rules of consumption behavior of teachers and students in the canteen can be found out. The total volume of future transactions can be forecasted The accuracy of forecast is high, and the relative error reaches an acceptable range. Administrators of the university can use this information for scientific and efficient management, so as to get a breakthrough in the management level.

Key words: campus one-card; RapidMiner; canteen; forecast; data mining

1 背景

當今社會處于信息技術高速發展的時期,各行各業都會產生很多數據。同時,數據挖掘、大數據、云計算等信息技術日新月異,發展很快,使得眾多高校日益重視本身的校園信息化建設。校園一卡通建設在校園信息化建設中又是優先建設的重點。而校園一卡通的使用過程,就是各種相關數據信息的流通與存儲。比如,師生使用校園一卡通進行刷卡消費、門禁刷卡、上課考勤、會議考勤、水電充值和圖書借閱等[1],都會產生數據。產生的每一條簡單的數據匯聚存儲起來就形成了一個龐大的數據庫。如果針對這個數據庫去提取、處理、分析,就可以形成一份非常有用的報告。基于報告的分析與結果,既可為校園建設提供科學依據,也可提升學校相關職能部門的管理水平。

以某高校校園一卡通消費系統的食堂營收數據為研究對象,對營收數據深入挖掘并加以處理分析,找到高校師生在食堂的消費行為習慣,預測未來的數據變化趨勢,形成可靠建議供學校相關職能部門參考,從而改進管理與服務方式,通過食堂精準服務促進營收[2]。該高校接近3萬師生,每人都配有一卡通校園卡,食堂售賣無現金,也沒有微信或支付寶直接支付,所以食堂的收入幾乎都是來自一卡通刷卡行為。因此,以一卡通食堂消費數據來研究分析與預測師生在食堂消費行為習慣是可行的。結合現有的分析方法與類似案例,首先對數據進行預處理,再通過合適的模型進行挖掘分析,找出消費產生的時間序列發展的趨勢和規律,得出師生消費行為習慣的結果,最后檢驗結果的準確性并預測發展趨勢。挖掘過程總的流程圖如圖1所示。

2 數據準備

數據挖掘是從大量的數據中建立合適的算法模型,根據一定的算法找出隱含的規律或人們感興趣的信息。為使結果精準、可靠,首先要提高被挖掘數據的質量,即對數據進行預處理。這里選取的數據挖掘工具為RapidMiner 9.4版本。RapidMiner提供了豐富的數據挖掘分析和算法功能,用戶通過圖形化開發環境,用拖拽的方式來設計分析流程,使用便捷,無需編程就可以進行分析挖掘[3]。它運算速度快,常用于解決各種商業關鍵問題。為達到RapidMiner數據挖掘的數據需求,數據準備一般需要數據抽取、數據預處理等。

2.1 數據抽取

目前,某高校一卡通建設還處于初級階段,校園卡主要用途為食堂消費。根據初步統計的結果,發現食堂消費占約94.8%,而師生考勤、門禁等刷卡功能還不成熟,沒有得到普遍應用,僅僅占約5.2%。在食堂消費中,消費行為又分別發生在6個食堂,因此需要抽取全部食堂消費的總流水數據作為研究對象。然后考慮到物價隨時間會有變化,實驗中只分析全部食堂交易流水中總的交易筆數而不是消費金額。借助RapidMiner工具,將作為訓練數據集的一卡通各個食堂交易筆數總和抽取出來,在RapidMiner設計視圖(Design)中導入操作流程(Process)。

2.2 數據預處理

數據預處理階段,是提高數據的質量并使其適合用于RapidMiner工具進行挖掘,其主要內容為數據清洗、缺失值處理、數據集成、數據變換和數據規約。食堂消費數據比較規范,只需進行數據清洗、缺失值分析和異常值分析即可。

數據清洗的主要目的是根據高校的需求和建模的特點篩選出需要的數據。校園一卡通系統中的食堂消費數據主要是由教師、學生產生,但還有一些由教師家屬、工勤教輔人員和參加培訓的少量社會人士刷卡產生,為了保證研究數據的可靠性和穩定性,需要抽取教師和學生這個主體對象的數據,而把其它噪音數據清理掉。數據導入時,在“Cell range”處選擇教師和學生所在字段即可達到數據清洗的目的。

對數據進行簡單的視覺評估,發現因停電、自然災害等不可抗拒因素造成的數據缺失,調用“Replace Missing Value”操作符對缺失值進行插補。插值法有很多種,這里采用均值插補法。還有極少部分異常值,通過視覺評估很容易發現,可以調用“Filter Examples”操作符添加過濾條件以過濾掉這些異常值。

3 數據分析和挖掘

3.1 數據初步分析

對高校食堂的營業數據進行分析,得出結論如下:

1)以學年為時間軸,食堂一個學年的營業數據規律性地出現了兩個分水嶺,分別是節假日(周六、周日、寒假、暑假)和工作日的食堂消費,節假日的刷卡消費數據遠小于工作日的刷卡消費數據,說明校內師生更多是選擇工作日在學校食堂消費。

2)節假日師生外出消費多,特別是寒、暑假留校師生很少,分析食堂節假日的刷卡消費數據,沒有明顯的消費時間峰值規律,通過食堂刷卡數據來尋找相關時間序列,要排除節假日與寒暑假的季節性的影響。

3)工作日有幾個規律的消費高峰時間段,分別是7:40-8:10,9:40-10:00,11:30-12:10,17:00-17:30。食堂出現消費高峰期與學校上、下課時間、食堂的位置有關;午餐數據峰值明顯高于晚餐數據峰值,說明晚上部分師生沒有在學校進餐。

4)食堂年營業數據中,2017年食堂刷卡數據同比出現了顯著的急速下降,之后2018至2020年食堂消費數據同比都顯著下降,這是由于學校因特殊情況在2017年開始逐年大量減少招生人數,因而出現食堂刷卡消費逐年減少的結果。

3.2 模型建立

數據準備完成后,接著進入建模階段,尋找最優的算法。食堂交易筆數的月資料是以月為單位的時間序列,而時間序列分析和預測常使用分類和回歸類型的算法。這里嘗試了線性回歸、ARIMA和神經網絡三種模型[4]。以ARIMA模型為例,在RapidMiner設計界面中模型建立的流程如圖2所示。

首先,對訓練數據集調用“Set Role”操作符,和訓練數據輸出端鏈接,在參數設置界面里,選擇訓練數據集中“交易筆數”的字段作為 “label”,即對它指定為標簽類型,后面模型學習中還會繼續如此設置這個字段為一個標記屬性。對于測試數據集也重復以上的操作。然后,為了找出訓練數據集中找出各項之間的關聯關系,調用“Correlation Matrix”操作符,建立相關鏈接,進行關聯規則分析。結果發現交易筆數與時間的相關性很高,其他字段都遠遠低于0.5,所以被RapidMiner自動剔除。

然后,調用“Split Data”分割數據操作符,將食堂消費數據選取90%設置為訓練數據,10%設置為測試數據。再調用ARIMA模型操作符并調用“Apply Model”應用模型操作符。同樣,可選擇“Linear Regression”線性回歸和“Neural Net”神經網絡模型進行測試。

3.3 模型評估

模型評估就是評估數據挖掘中用到的算法模型對挖掘分析和預測結果的準確性影響,通過檢測結果的是否在置信區間,誤差是否可以接受,判定結果是否達到目的。連接“Performance”性能測試操作符,驗證模型的準確性。對本次樣本數據,ARIMA模型預測分析具有較高的準確度,預測效果是最好的。將需要預測的新數據導入模型,連接“Apply Model”應用模型,運行并輸出預測結果。調用“Validation”交叉驗證數據集進行模型評估,如圖3所示。進去交叉驗證操作符,里面還有子流程,可以選擇ARIMA等多個模型.進行驗證。如圖4所示。

用相對絕對誤差、平均絕對誤差、根均方差、相對平方根誤差等指標來衡量。這里選用相對絕對誤差來衡量,符合預期。預測值和實際值統計結果如表1所示。

4 高校食堂管理改進措施

通過實驗來構建出師生消費的時間序列曲線,可以更深層次挖掘數據里面的意義[5]。首先,食堂節假日與工作日的消費量不同,前者明顯小于后者;其次,工作日食堂刷卡消費有明顯且規律的峰值。因此,通過學校師生的消費習慣分析,建議食堂管理部門調整經營管理策略。

1)在就餐高峰期加派工作人員,增加服務窗口,減少排隊現象。

2)增加菜品數量,改善菜品味道,推出不同特色菜品,盡可能滿足不同消費者品位,吸引更多師生回歸食堂消費。

3)位置靠近學生生活區和教學樓的飯堂,是最多師生就餐選擇的食堂,所以要繼續重視服務與菜品,才能做到不流失舊消費者,吸引新的師生在此養成就餐習慣。

4)主要食堂每天進餐人數最多,可適當延長營業時間。在保持好三餐服務質量的前提下,增加下午茶或者宵夜菜品,加強服務,打造學校品牌和口碑。

5)位置較偏且陳舊的飯堂,客容量小,需要學校下撥資金進行翻新整改,改善照明與通風。由于位置較偏不能改變,建議食堂推出特色餐,差別營銷,吸引顧客。

5 結束語

本文以某高校近5年的食堂消費數據為對象,將數據挖掘平臺RapidMiner應用于高校一卡通數據的分析與預測,結合學校實際情況來判定食堂經營情況與預測經營發展趨勢。運用多種模型訓練并進行比較,找出性能最優的ARIMA模型,然后對模型應用和預測,與實際值比較,預測效果良好。今后,隨著一卡通系統功能的進一步擴展,將會產生大量的上課考勤數據,圖書借閱數據,琴房借用數據等,這些數據存在有價值的信息,若能夠運用現代信息技術去充分挖掘里面的令人感興趣的東西,將會給學校的整體管理提供更大的幫助。

參考文獻:

[1] 袁學松.智慧校園一卡通建設實踐和探索[J].電腦知識與技術,2020,16(10):42-43.

[2] 龔黎旰,顧坤,明心銘,等.基于校園一卡通大數據的高校學生消費行為分析[J].深圳大學學報(理工版),2020,37(S1):150-154.

[3] 李冠利.基于RapidMiner數據挖掘技術的NCRE成績預測分析[J].南京廣播電視大學學報,2018(4):80-82.

[4] Huang T W,Jiao F.Study on data transfer in meteorological forecast of small and medium-sized cities and its application in Zhaoqing city[J].The Computer Journal,2020,63(7):1076-1083.

[5] 曹芳,章翰源.基于大數據的學生食堂消費畫像構建及其應用[J].湖南郵電職業技術學院學報,2020,19(4):27-30.

【通聯編輯:謝媛媛】

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲欧美在线综合一区二区三区| 亚洲福利一区二区三区| 毛片手机在线看| 国产一在线观看| 国产成人免费观看在线视频| 国产在线97| 久久精品午夜视频| 欧美成人国产| 国产亚洲欧美日韩在线观看一区二区| 日韩美毛片| 久久久久亚洲精品成人网| 激情综合激情| 久久中文电影| h网站在线播放| 亚洲va在线∨a天堂va欧美va| 第一页亚洲| 国产电话自拍伊人| 精品久久蜜桃| 精品视频一区在线观看| 日本五区在线不卡精品| 久久人妻xunleige无码| 三区在线视频| 国产乱子伦精品视频| 亚洲天堂网在线观看视频| 久久婷婷五月综合色一区二区| 久久96热在精品国产高清| 亚洲天堂成人在线观看| 国产一在线观看| 欧美性色综合网| 久久久久人妻一区精品| 日本中文字幕久久网站| 色偷偷一区| 人妻熟妇日韩AV在线播放| 成人福利在线看| 亚洲综合经典在线一区二区| 日韩AV无码免费一二三区| 一级毛片免费观看不卡视频| 成人免费黄色小视频| 一本色道久久88综合日韩精品| 制服丝袜在线视频香蕉| 大香伊人久久| 国产一区二区三区在线精品专区| 亚洲视频三级| 青青草原国产一区二区| 国产成人亚洲无吗淙合青草| 久久性妇女精品免费| 国产成人啪视频一区二区三区| 在线免费看黄的网站| 2021国产在线视频| 91亚洲视频下载| 无码一区中文字幕| 成人免费网站久久久| 中文字幕在线一区二区在线| 在线免费无码视频| 天天摸天天操免费播放小视频| 日韩欧美国产综合| 黄色网页在线观看| 亚洲第一视频免费在线| 国产欧美日韩视频怡春院| 亚洲第一视频免费在线| 99人体免费视频| 国产亚洲精品yxsp| 亚洲成a人片在线观看88| 国产美女一级毛片| 婷婷综合缴情亚洲五月伊| 美女免费黄网站| 国产亚洲精品97AA片在线播放| 日韩欧美国产中文| 理论片一区| 伊人久综合| 人妖无码第一页| 国产精品三级专区| 国内a级毛片| 国产中文一区二区苍井空| 国产精品香蕉在线| 国产性爱网站| 国产色爱av资源综合区| 国产成人精品高清不卡在线| 国产成人精品视频一区视频二区| 国产成人精品亚洲77美色| 国产精鲁鲁网在线视频| 亚洲欧美成aⅴ人在线观看 |