何郁波,曾 楨,蘭燕鴻,黃遵杰
(懷化學院 數學與計算科學學院,湖南 懷化 418008)
在移動互聯網和智能手機APP等創新技術的驅動下,城市慢行交通領域作為一種新型事物逐漸出現.在城市居民的出行領域,打車類應用軟件的發展逐漸趨于穩定,但民眾在短途的出行中“最后一公里”出行的問題始終沒有得到解決.近年來,共享單車的出現,讓民眾多了一種綠色的出行方式可以選擇[1].共享單車的最大價值在于民眾出行的“最后3公里”,其無樁借還的模式相比于政府公共租賃自行車,使民眾借還單車更加快速和便捷.同時,共享單車引導政府部門重視慢行交通系統的建設,倡導民眾更多選擇綠色出行的方式,這些方面能在一定程度上緩解城市交通擁堵、改善城市環境.然而,共享單車作為新興事物,隨著共享單車平臺企業在各大城市開始大量投放單車,共享單車的停放、安全出行等問題引起了社會的關注[1].
基于時間序列分析的方法,本文將對某一個定點對于共享交通工具的使用情況進行分析預測,從而為相關部門提供共享交通工具的投放與管理提供依據.所謂時間序列,就是按照時間的順序將某種現象的某一個統計指標的數值排列而形成的序列.對時間序列進行觀察、研究,尋找它變化發展的規律,預測它將來的走勢.常見的預測方法有利用回歸的方式建立相應的模型預測,如利用支持向量機回歸、線性回歸等預測方法[2];有采用徑向基函數(RBF)神經網絡模型對時間序列進行擬合及預測[3].
在時序分析中,求和自回歸移動平均(autoregressive integrated moving average, ARIMA)模型是時間序列預測方法最為經典的模型.將具有如下結構的模型稱為ARIMA(p,d,q)模型:
(1)
利用ARIMA模型對一些重要時序進行預測和應用目前已取得了大量非常重要的結果.文[4]針對工控系統現場控制層數據進行分析,利用數據的時序性,通過ARIMA模型預測出后續時刻系統數據的信息.李勃旭等運用研發的數據采集系統對新上線地鐵門的夾緊力進行實時采集,對于采集后的時序數據利用ARIMA模型與EMD-ARIMA模型對夾緊力峰值的均值和標準差隨累計運行時間的變化趨勢進行預測,獲得了非常有用的結論[5].針對煙草行業的供給,文[6]利用ARMA模型對煙草的供給和配送進行了預測.關于ARIMA模型與其他模型相結合的方法,也有諸多的文獻進行了研究.王濤采用ARIMA模型、BP神經網絡模型和Holt指數平滑模型對1995-2017年上海電力需求數據進行建模分析,構建了組合模型,并依據組合模型預測了未來五年的上海市電力需求量趨勢[7],擬合的效果較好,有利于電力供應單位穩定電力供應,促進經濟社會發展.同時,結合ARMA和GARCH建立預測模型的成果表明:在擬合效果上,ARMA-GARCH模型較優;在預測效果方面,ARMA模型最優[8].其他一些相關的成果可參閱以上所列的文獻及其中所介紹的相關參考文獻.
數據預處理及相應分析的流程圖如圖1所示.以湖南省懷化市第一人民醫院為觀測點,對2018年6月27日—2018年9月15日的觀測統計,以7:30—18:30為觀測時間段,共獲得81天的共享單車日使用臺·次,結果見表1.

圖1 確定時間序列模型流程圖
將原始序列記為X-user,對序列X-user進行純隨機性檢驗,即白噪聲檢驗.利用SAS軟件對序列X-User進行白噪聲檢驗結果如表2所示.表2的白噪聲檢驗結果表明,延遲6,12和18期的χ2統計量的相伴概率都小于顯著性水平5%,因此原序列X-user屬于非白噪聲序列,具有相關性.

表2 白噪聲檢驗結果
序列X-user的時序圖見圖2,由時序圖可知該序列是平穩序列,均值為52.6667,標準差18.3397.

圖2 原始序列的時序圖
為了對模型進行識別并定階,采取對序列的自相關以及偏自相關的拖尾或截尾的性質來進行判別.利用SAS對X-user序列進行分析,自相關和偏自相關系數圖3.

圖3 序列X-user的自相關圖
由自相關圖可知序列X-user的自相關圖延遲1期以后雖然在2倍標準差的范圍之內,但是一直到延遲12期自相關系數保持一定的拖尾性.圖4序列X-user的偏自相關系數在延遲1期以后出現截尾性,因此嘗試擬合AR(1)模型.

圖4 序列X-user的偏自相關圖
使用條件最小二乘估計方法,確定AR(1)模型的口徑為
(2)
且Var(εt)=299.6057.
殘差的白噪聲檢驗顯示延遲6階、12階、18階、24階所對應的LB檢驗統計量的P值均顯著大于0.05,所以該AR(1)模型是顯著有效的.

表3 殘差的白噪聲檢驗結果
對參數的顯著性進行檢驗,結果顯示兩參數t統計量的P值都小于0.05,因此兩個參數都顯著.因此AR(1)模型是序列的有效擬合模型.

表4 條件最小二乘估計結果
為了更好地擬合原始序列,搜索最優的模型.通過序列自相關圖2顯示,該序列自相關系在5階以后表現一定的截尾性,另外偏自相關系數帶一定的拖尾性,因此考慮用MA(5)模型進行擬合.同樣采用條件最小二乘法對相關參數進行估計,得到MA(5)模型口徑為
X-usert=52.71613+(1+0.35179B+0.07076B2+0.06588B3+0.16252B4+0.18323B5)εt且Var(εt)=300.9124.
殘差的白噪聲檢驗結果顯示擬合的模型顯著有效,另外對于參數進行顯著性檢驗結果為所有待估的參數均顯著.
為了比較兩個模型的優劣性,引入AIC和SBC信息準則.檢驗結果如表5.

表5 擬合模型的AIC和SBC信息準則結果
最小信息量的檢驗顯示,AR(1)模型無論使用AIC準則還是SBC準則均優于MA(5)模型.為了避免漏掉最優的模型,我們采用在IDENTIFY命令中增加一個可選命令MINICp=(0:5),q=(0:5),獲得原始序列中所有自相關延遲階數小于等于5,移動平均延遲階數也小于等于5的ARMA(p,q)模型.
由表6的最小信息準則結果可知,在自相關延遲階數和移動平均延遲階數小于等于5的所有ARMA(p,q)模型中,BIC信息量相對最小的是BIC(1,3)=5.720673,即ARMA(1,3)模型.采用條件最小二乘估計,各參數的估計值結果見表7.估計結果顯示,所有的參數均顯著(t檢驗統計量的P值均小于0.05).

表6 最小信息準則結果

表7 ARMA(1,3)模型參數的條件最小二乘估計結果
新模型ARMA(1,3)的殘差自相關檢驗結果表8顯示,由于延遲各階的LB統計量的P值均顯著大于α(α=0.05),所以該擬合模型顯著有效.

表8 ARMA(1,3)模型的殘差自相關檢驗結果
擬合模型為
(3)
根據上述所得模型,利用SAS軟件對第82,83,84,85,86期共5期懷化市第一人民醫院共享單車的使用進行預測,預測結果和實際的觀察結果如表9所示.

表9 共享單車的短期預測結果
從表9的預測結果與實際值的比較可知,模型對于短期的預測具有較高的吻合度,共享單車日使用臺數預測95%的置信區間很好的包含了實際值.具體的預測結果見圖5.圖中實線所顯示的為預測值,虛線所夾部分為置信水平為95%的置信區間.

圖5 共享單車日使用臺數預測的95%置信區間結果
采用ARMA模型對2018年6月27日—2018年9月15日期間某一固定地點共享單車的使用數據進行建模分析,利用SAS軟件對所建立模型的有效性、參數的顯著性進行了檢驗,從而獲得了共享單車使用所滿足的模型口徑.利用訓練樣本和檢驗樣本對所建立的模型進行了檢驗,結果表明所建立的模型擬合效果較好,短期預測精度較高,從而對管理部門的投放和管理工作提供了可靠的依據.