999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA和Holt-Winters的消費(fèi)行為預(yù)測(cè)①

2021-09-10 07:32:20黃天文
關(guān)鍵詞:模型

黃天文,焦 飛

1(廣東省肇慶市氣象局,肇慶 526060)

2(肇慶學(xué)院,肇慶 526061)

信息化時(shí)代,校園一卡通已成為校園信息化建設(shè)的重要支撐部分.它既能反映校園信息化建設(shè)的有效性,又能改善學(xué)校管理和服務(wù),為廣大師生帶來便利.一卡通管理系統(tǒng)收集了大量數(shù)據(jù),涵蓋了諸如食堂或超市消費(fèi)、學(xué)生考勤、教師考勤與會(huì)議出勤、各種門禁、圖書借閱、熱水和飲用水等多個(gè)領(lǐng)域.近年來,這些數(shù)據(jù)倍受關(guān)注,特別是眾多學(xué)者開始高度重視各種領(lǐng)域的時(shí)間序列預(yù)測(cè)研究,基于大數(shù)據(jù)方法的研究與應(yīng)用前景廣闊[1,2].本文以某學(xué)校教師和學(xué)生在食堂消費(fèi)的交易數(shù)據(jù)為研究對(duì)象,通過對(duì)消費(fèi)數(shù)據(jù)分析和預(yù)測(cè)的研究,挖掘出學(xué)校食堂消費(fèi)的變化規(guī)律和未來發(fā)展趨勢(shì),并提供較為準(zhǔn)確的預(yù)測(cè),給學(xué)校后勤部門提供了參考意見.這將有助于學(xué)校的建設(shè)和管理.特別是管理食堂的學(xué)校后勤部門可據(jù)此加強(qiáng)管理,更好地滿足廣大師生的消費(fèi)需求.研讀了大量的相關(guān)文獻(xiàn),大數(shù)據(jù)挖掘和分析應(yīng)用領(lǐng)域廣泛,結(jié)合遷移學(xué)習(xí)方法可以更好地預(yù)測(cè)氣象因子時(shí)間序列的變化趨勢(shì)[3],多時(shí)間尺度時(shí)間序列趨勢(shì)預(yù)測(cè)算法可對(duì)股票、基金等未來變化進(jìn)行預(yù)測(cè)[4].學(xué)習(xí)了前人做過的一些分析方法和實(shí)例[5-8],認(rèn)為食堂消費(fèi)數(shù)據(jù)是平穩(wěn)的單序列,適合用ARIMA模型擬合與預(yù)測(cè)[9,10].但ARIMA 只能建立線性的模型,而現(xiàn)實(shí)世界中用純線性模型擬合很難達(dá)到實(shí)驗(yàn)預(yù)期要求,由于學(xué)校食堂消費(fèi)行為和假期密切相關(guān),有明確周期性的特點(diǎn),又可考慮Holt-Winters 方法[11,12].本實(shí)驗(yàn)分別使用了這兩種方法,而擬合和預(yù)測(cè)的結(jié)果通過檢驗(yàn)、對(duì)比,發(fā)現(xiàn)Holt-Winters 預(yù)測(cè)的精度更高,是更優(yōu)的方案.

1 數(shù)據(jù)預(yù)處理

首先收集原始數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,目的是把未加工的數(shù)據(jù)轉(zhuǎn)換成適合挖掘處理的形式,然后進(jìn)行擬合分析,最后做出預(yù)測(cè)并檢驗(yàn)結(jié)果的準(zhǔn)確性[13].數(shù)據(jù)挖掘,是指從海量的數(shù)據(jù)中通過一定的算法發(fā)現(xiàn)人們有興趣的信息的過程.為了提高數(shù)據(jù)的質(zhì)量,為下一步的分析提供有效及可用的數(shù)據(jù),需要進(jìn)行數(shù)據(jù)預(yù)處理.數(shù)據(jù)噪聲是原始數(shù)據(jù)的各個(gè)變量的隨機(jī)誤差或方差,可以使用移動(dòng)平均法、指數(shù)平滑法等方法來消除之,更真實(shí)地反映出時(shí)間序列的發(fā)展趨勢(shì).時(shí)間序列的短期預(yù)測(cè)方法有很多,其基本思想為:消除一些不規(guī)則變化,得到時(shí)間序列一些基本的變化模式,然后按照此變化模式向后展開.因此在數(shù)據(jù)預(yù)處理階段,消除一卡通數(shù)據(jù)中那些隨時(shí)間的不規(guī)則變化,把它的基本變化模式更顯著地描述出來是很有必要的.

1.1 數(shù)據(jù)清理

數(shù)據(jù)清理,就是清除一卡通數(shù)據(jù)中的噪聲,去除與研究無關(guān)的因素.校園一卡通系統(tǒng)中的數(shù)據(jù)主要是由教師、學(xué)生,還有少量的工人、教師家屬和社會(huì)人士刷卡產(chǎn)生.為了保證研究數(shù)據(jù)的可靠性和穩(wěn)定性,要根據(jù)需求,針對(duì)性地研究教師和學(xué)生這個(gè)主體對(duì)象,而把少量的其他人隨機(jī)性的刷卡數(shù)據(jù)清理掉,以免影響實(shí)驗(yàn)效果.目前,某校一卡通建設(shè)還處于初級(jí)階段,校園卡主要用途暫時(shí)為食堂消費(fèi).初步統(tǒng)計(jì)結(jié)果發(fā)現(xiàn)一個(gè)教工食堂和兩個(gè)學(xué)生食堂消費(fèi)占約94.8%,其他的消費(fèi)則發(fā)生在學(xué)校小賣部、飲用水和熱水等,數(shù)據(jù)清理容易實(shí)現(xiàn).研究針對(duì)相對(duì)平穩(wěn)的、全部食堂總的交易筆數(shù)組成的時(shí)間序列,當(dāng)然,今后也可以對(duì)消費(fèi)金額進(jìn)行研究.

1.2 數(shù)據(jù)平滑

一卡通系統(tǒng)導(dǎo)出的數(shù)據(jù)是不平滑的,這對(duì)變化曲線的擬合來說就有影響.有的噪聲數(shù)據(jù)會(huì)影響擬合函數(shù)的準(zhǔn)確性,在對(duì)時(shí)間序列變化趨勢(shì)的曲線進(jìn)行擬合前,應(yīng)該進(jìn)行平滑處理.受周期變動(dòng)和隨機(jī)波動(dòng)的影響,全部食堂逐年的月消費(fèi)總筆數(shù)隨時(shí)間變化的起伏較大,給揭示時(shí)間序列發(fā)展趨勢(shì)帶來困難,而使用Holt-Winters和ARIMA 方法就能解決這個(gè)問題.這兩種方法對(duì)含有線性趨勢(shì)和周期波動(dòng)的非平穩(wěn)序列適用,而且利用指數(shù)平滑法(EMA)能讓模型參數(shù)不斷適應(yīng)非平穩(wěn)序列的變化,并對(duì)未來趨勢(shì)進(jìn)行短期預(yù)報(bào).首先觀察原始序列變化趨勢(shì)圖,如圖1所示.

圖1 食堂消費(fèi)數(shù)據(jù)之原始時(shí)間序列的變化趨勢(shì)

為了對(duì)數(shù)據(jù)序列進(jìn)行平穩(wěn)性分析,將非平穩(wěn)性數(shù)據(jù)處理成平穩(wěn)性數(shù)據(jù),然后建立最優(yōu)食堂逐年的月交易量預(yù)測(cè)模型,最后將預(yù)測(cè)值與實(shí)際交易量進(jìn)行對(duì)比,檢驗(yàn)預(yù)測(cè)效果.時(shí)間序列經(jīng)平滑處理后的變化趨勢(shì)如圖2所示,此時(shí)已能看出變化趨勢(shì)存在顯著的季節(jié)性.

圖2 食堂消費(fèi)數(shù)據(jù)之平滑后的時(shí)間序列變化趨勢(shì)

2 數(shù)據(jù)分析

2.1 初步分析

統(tǒng)計(jì)樣本為學(xué)校的食堂在節(jié)假日與工作日期間使用一卡通消費(fèi)的情況,根據(jù)平滑后的曲線進(jìn)行初步分析,消費(fèi)變化趨勢(shì)可以粗略地歸納如下:

(1)從食堂節(jié)假日刷卡情況與工作日刷卡情況對(duì)比來看,兩個(gè)期間交易次數(shù)明顯不同,前者交易次數(shù)明顯少于后者交易次數(shù).

(2)節(jié)假日期間,特別是寒、暑假,由于在校師生明顯減少,在學(xué)校食堂消費(fèi)行為也大幅下降沒有存在明顯的刷卡消費(fèi)峰值,說明被研究的時(shí)間序列具有顯著的季節(jié)性特點(diǎn).

(3)自2017年開始食堂消費(fèi)交易次數(shù)有減少的趨勢(shì),這和學(xué)校因某項(xiàng)目工作的需要而減少招生規(guī)模有密切關(guān)系.

2.2 模型的選擇

統(tǒng)計(jì)樣本為學(xué)校的食堂在節(jié)假日與工作日期間使用一卡通消費(fèi)的情況,根據(jù)平滑后的曲線進(jìn)行初步分析,消費(fèi)變化趨勢(shì)可以粗略地歸納如下:

首先考慮使用ARIMA 模型.ARIMA是Autoregressive Integrated Moving Average Model的縮寫,稱為自回歸滑動(dòng)平均模型.該模型特點(diǎn)是不直接考慮其他相關(guān)隨機(jī)變量的變化.既帶有趨勢(shì)又有季節(jié)性趨勢(shì)的模型為ARIMA(p,d,q)×(P,D,Q)S.其中的非季節(jié)性參數(shù)p,d,q和季節(jié)參數(shù)P、D、Q將在后面的分析中確定,而S為時(shí)間序列的周期,這里選年周期,12 個(gè)月,即S=12.但ARIMA 只能建立線性的模型,而純線性模型在現(xiàn)實(shí)世界中還是少見的,用ARIMA 模型來分析有時(shí)會(huì)達(dá)不到預(yù)期效果.初步實(shí)驗(yàn),通過差分與季節(jié)差分運(yùn)算去除時(shí)間序列的趨勢(shì)與季節(jié)成分,將原序列平穩(wěn)化.用條件最小二乘法進(jìn)行參數(shù)估計(jì),并進(jìn)行顯著性檢驗(yàn)[14],發(fā)現(xiàn)此模型擬合變化曲線的效果不是很好.模型的評(píng)估有兩種準(zhǔn)則,分別是赤池信息準(zhǔn)則(AkaikeInformation Criterion,AIC)和貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC),這里使用BIC 準(zhǔn)則.根據(jù)非季節(jié)性參數(shù)p,d,q和季節(jié)參數(shù)P、D、Q多種不同的組合中選取BIC的值最小的組合.最后得到模型為ARIMA(1,1,2)(0,1,0),平穩(wěn)的R方為0.725,BIC為25.平穩(wěn)的R方主要用于測(cè)定線性回歸的擬合度,取值范圍為0<│R│≤1.R越大,因變量與解釋變量間的線性關(guān)系越顯著[15].預(yù)測(cè)結(jié)果如表1所示.建立95%的預(yù)測(cè)區(qū)間,表中的UCL為預(yù)測(cè)上限,LCL為預(yù)測(cè)下限.

表1 基于ARIMA 模型的食堂消費(fèi)之交易筆數(shù)預(yù)測(cè)效果

由表1可見,3、4、5 三個(gè)月的相對(duì)誤差增長(zhǎng)很快,5月的預(yù)測(cè)值相對(duì)誤差超過了10%,后續(xù)預(yù)測(cè)不可靠,實(shí)驗(yàn)效果沒有符合預(yù)期.于是改用Holt-Winters 乘法模型,經(jīng)過3 次指數(shù)平滑實(shí)驗(yàn),可發(fā)現(xiàn)擬合和預(yù)測(cè)的效果會(huì)更好.Holt-Winters 在兩參數(shù)指數(shù)平滑的基礎(chǔ)上,引入第3 個(gè)參數(shù)處理數(shù)據(jù)季節(jié)性,也稱為三階指數(shù)平滑[16].三參數(shù)指數(shù)平滑模型本質(zhì)上是一種高級(jí)指數(shù)平滑模型,可同時(shí)處理趨勢(shì)和季節(jié)性變化,可適當(dāng)?shù)剡^濾隨機(jī)波動(dòng)的影響,對(duì)兼有長(zhǎng)期趨勢(shì)和季節(jié)模式的數(shù)據(jù)進(jìn)行預(yù)測(cè).

2.3 結(jié)果檢驗(yàn)、對(duì)比與分析

統(tǒng)計(jì)樣本為學(xué)校的食堂在節(jié)假日與工作日期間使用一卡通消費(fèi)的情況,根據(jù)平滑后的曲線進(jìn)行初步分析,消費(fèi)變化趨勢(shì)可以粗略地歸納如下:

建模過程是一個(gè)不斷優(yōu)化、不斷改進(jìn)的過程,沒有絕對(duì)的標(biāo)準(zhǔn)答案,而是最終取盡量好的結(jié)果.Holt-Winters 算法也叫三次指數(shù)平滑算法,是在一次指數(shù)平滑、二次指數(shù)平滑算法基礎(chǔ)上改進(jìn)的,它適用于預(yù)測(cè)具有趨勢(shì)性和季節(jié)性的時(shí)間序列,有加法模型和乘法模型兩種[17],當(dāng)季節(jié)性變化相對(duì)穩(wěn)定時(shí)一般使用加法模型,當(dāng)季節(jié)性變化呈現(xiàn)比例變化特點(diǎn)時(shí)一般使用乘法模型[18].這里選擇了Holt-Winters 乘法模型,可從長(zhǎng)期趨勢(shì)、周期兩個(gè)方面進(jìn)行分析.乘法模型公式如下:

以上4 個(gè)公式中,α為水平平滑系數(shù),β為趨勢(shì)平滑系數(shù),γ為季節(jié)平滑系數(shù),它們大小介于0和1 之間.Yt為t時(shí)刻的實(shí)際值,Lt為t時(shí)刻的水平值,Tt為t時(shí)刻的趨勢(shì)值,St為t時(shí)刻的季節(jié)值,k為外推預(yù)測(cè)時(shí)期數(shù),p為周期長(zhǎng)度.對(duì)2019年3月、4月和5月的食堂消費(fèi)總交易筆數(shù)進(jìn)行預(yù)測(cè),模型統(tǒng)計(jì)量如表2所示.

表2 食堂消費(fèi)Holt-Winters 乘法模型的統(tǒng)計(jì)量

對(duì)結(jié)果檢驗(yàn)可知該模型擬合中平穩(wěn)的R方達(dá)到0.772,高于0.5 這個(gè)平均水平;季節(jié)變動(dòng)的整體R方為0.944,接近1,因此擬合效果還是很不錯(cuò)的.最后看正態(tài)化的BIC 值,為24.133,不算太大,這進(jìn)一步證明了該模型的擬合效果良好[19].方差分析結(jié)果通過F 檢驗(yàn).F 統(tǒng)計(jì)量的概率Sig 值是顯著性指標(biāo),一般大于0.05 拒絕原假設(shè),否則接受原假設(shè).本次實(shí)驗(yàn)結(jié)果,Sig的值為0.02,小于0.05,說明在顯著性水平位,可以使用該模型.

利用SPSS 軟件,進(jìn)行模型的建立和分析,最后得到擬合和預(yù)測(cè)的效果圖[20,21].先作擬合線和預(yù)測(cè)值95%的置信區(qū)間的上限和下限兩條虛線,如圖3所示.

圖3 基于Holt-Winters 乘法模型的擬合值在95%的置信區(qū)間的分布情況

圖3中的細(xì)實(shí)線為一卡通系統(tǒng)數(shù)據(jù)庫(kù)里記錄的交易筆數(shù)實(shí)際值,而粗實(shí)線則為Holt-Winters 乘法模型的預(yù)測(cè)值,兩條虛線UCL和LCL 分別為預(yù)測(cè)值95%的置信區(qū)間的上限和下限,由圖3可見擬合線在兩條虛線劃分的區(qū)域之內(nèi),同樣預(yù)測(cè)線也是如此.

擬合與預(yù)測(cè)效果見圖4,虛線為觀測(cè)值,實(shí)線為擬合線.可見食堂消費(fèi)交易筆數(shù)的變化是包含季節(jié)變動(dòng)成分的,同時(shí)還有減弱的趨勢(shì).圖4的右側(cè)為對(duì)2019年3、4、5 三個(gè)月的預(yù)測(cè)值和觀測(cè)值的擬合情況,效果很好.

圖4 基于Holt-Winters 乘法模型的擬合與預(yù)測(cè)效果圖

檢驗(yàn)相對(duì)誤差的結(jié)果如表3所示.通過與實(shí)際數(shù)據(jù)對(duì)比,計(jì)算出預(yù)測(cè)的相對(duì)誤差均低于10%,并且相對(duì)于表1,實(shí)驗(yàn)效果得以改進(jìn),預(yù)測(cè)準(zhǔn)確度更高,證明對(duì)這組食堂消費(fèi)數(shù)據(jù)的分析中使用Holt-Winters 乘法模型預(yù)測(cè)效果更好.

表3 基于Holt-Winters 乘法模型的食堂消費(fèi)交易筆數(shù)預(yù)測(cè)效果

3 學(xué)校食堂管理重點(diǎn)和改進(jìn)措施

由以上校園一卡通消費(fèi)數(shù)據(jù)實(shí)驗(yàn)分析可知,學(xué)校節(jié)假日與平時(shí)的消費(fèi)習(xí)慣存在明顯的差異[22,23],建議學(xué)校相關(guān)管理部門可以根據(jù)持卡用戶的消費(fèi)習(xí)慣做出調(diào)整:

(1)在節(jié)假日期間,食堂就餐刷卡交易次數(shù)較少,可以通過適當(dāng)停止個(gè)別食堂的營(yíng)業(yè),縮小售飯區(qū)域,輪休工作服務(wù)人員來達(dá)到節(jié)省開支的目的.

(2)在節(jié)假日期間,學(xué)生的消費(fèi)習(xí)慣不統(tǒng)一,營(yíng)業(yè)檔口可以相應(yīng)調(diào)整營(yíng)業(yè)時(shí)間,并且可以根據(jù)學(xué)生在節(jié)假日的較高消費(fèi)特點(diǎn),提供較平時(shí)更為高檔的有特色的菜品吸引學(xué)生消費(fèi).

(3)食堂在3月、9-12月刷卡消費(fèi)頻次較高,應(yīng)當(dāng)提前準(zhǔn)備充分的貨源,適當(dāng)調(diào)整營(yíng)業(yè)時(shí)間,增加工作人員數(shù)量,提升服務(wù)質(zhì)量.

(4)食堂刷卡消費(fèi)長(zhǎng)期看有減弱的趨勢(shì),這和社會(huì)大環(huán)境有密切關(guān)系,那么根據(jù)社會(huì)實(shí)際情況,食堂應(yīng)減少營(yíng)業(yè)檔口數(shù),減少食材的購(gòu)買,甚至?xí)簳r(shí)關(guān)停部分食堂.而保持經(jīng)營(yíng)狀態(tài)的食堂應(yīng)結(jié)合實(shí)際情況,保證飯菜色、香、味、形的同時(shí),適當(dāng)增加花色品種,以吸引消費(fèi)者.

4 結(jié)論與展望

以某學(xué)校食堂消費(fèi)數(shù)據(jù)為研究對(duì)象,對(duì)2014年1月至2019年2月的月交易筆數(shù)構(gòu)成的時(shí)間序列進(jìn)行平滑處理,經(jīng)過反復(fù)地實(shí)驗(yàn),分別利用ARIMA和Holt-Winters 兩種方法進(jìn)行分析,其擬合和預(yù)測(cè)的結(jié)果通過檢驗(yàn)、對(duì)比,最終構(gòu)建了考慮季節(jié)性的Holt-Winters 乘法模型,取得較為理想的實(shí)驗(yàn)結(jié)果.建設(shè)數(shù)字化校園是眾多學(xué)校信息化建設(shè)的重要組成部分,而校園一卡通的建設(shè)會(huì)促進(jìn)數(shù)字化校園的發(fā)展.深入挖掘分析一卡通業(yè)務(wù)里的消費(fèi)數(shù)據(jù)對(duì)于分析師生的消費(fèi)行為有著重要意義.本次研究結(jié)果能夠?yàn)橄嚓P(guān)管理部門提供學(xué)生校內(nèi)真實(shí)可靠的消費(fèi)行為,用科學(xué)的方法研究食堂用卡消費(fèi)水平與規(guī)律,為學(xué)校的決策層在學(xué)校的發(fā)展上做出更為科學(xué)的判斷.今后,隨著一卡通建設(shè)的推進(jìn),還可以繼續(xù)研究門禁數(shù)據(jù),圖書館數(shù)據(jù)等,揭示學(xué)生的行為規(guī)律,為學(xué)校的管理提供參考.

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美日韩在线国产| 欧美一级夜夜爽| 国产精品无码一二三视频| 久久6免费视频| 伦伦影院精品一区| 欧美亚洲香蕉| 色成人亚洲| 五月婷婷综合色| 久久精品人人做人人爽电影蜜月| 久久99国产乱子伦精品免| 青草国产在线视频| 九九久久精品国产av片囯产区| 大香网伊人久久综合网2020| 天天综合色网| 97视频精品全国在线观看| 狠狠色综合网| 日韩国产黄色网站| 亚洲,国产,日韩,综合一区 | 天天综合亚洲| 日本欧美精品| 在线国产资源| yy6080理论大片一级久久| 在线精品欧美日韩| 老色鬼欧美精品| 高h视频在线| 91口爆吞精国产对白第三集| 99久久性生片| 国产白浆在线观看| 国产精品jizz在线观看软件| 日本亚洲成高清一区二区三区| 国产三区二区| 欧美成人一级| 这里只有精品在线播放| 精品国产黑色丝袜高跟鞋| 亚洲国产精品日韩av专区| 高清无码一本到东京热| 久久永久视频| 久青草国产高清在线视频| 国产伦精品一区二区三区视频优播| 凹凸国产分类在线观看| 国产成人av一区二区三区| 亚洲欧洲自拍拍偷午夜色| 国产欧美视频综合二区| 久久精品丝袜| 亚洲av片在线免费观看| 亚洲精品综合一二三区在线| 国产制服丝袜91在线| 国产精品第5页| 人人看人人鲁狠狠高清| 亚洲成人手机在线| 国产永久在线视频| 在线播放国产一区| 国产女同自拍视频| 日韩精品高清自在线| 成人综合久久综合| 免费国产在线精品一区| 国产新AV天堂| 亚洲欧美成人综合| 久久婷婷六月| 亚洲av色吊丝无码| 欧美日韩精品在线播放| 国产精品网址你懂的| 国产自在自线午夜精品视频| 最新加勒比隔壁人妻| 国产精品亚洲片在线va| 日本免费一级视频| 欧美日韩高清在线| 国产剧情无码视频在线观看| 又猛又黄又爽无遮挡的视频网站| 国产福利免费在线观看| 精品剧情v国产在线观看| 亚洲精品国产乱码不卡| 91成人免费观看| 98超碰在线观看| 亚洲国产精品一区二区第一页免| 99在线视频免费| 精品国产黑色丝袜高跟鞋| 99re66精品视频在线观看| 狠狠做深爱婷婷久久一区| 欧美日韩在线成人| 亚洲日韩日本中文在线| 免费a级毛片视频|