摘 要:隨著港口業和航運業的發展,集裝箱吞吐量作為能夠反映行業發展的重要指標越來越被人們所重視,對港口集裝箱吞吐量的預測也成為人們研究的一個熱點。研究方法包括一元線性回歸預測,指數回歸預測,灰色預測,神經網絡預測法等,由于集裝箱吞吐量具有很強的周期性和季節性,因此運用前面方法分析時很容易出現偏差。而ARIMA模型能彌補此缺陷。利用 ARIMA模型對上海港務集團2007-2012集裝箱吞吐量進行實證分析,利用進行短期預測,并給出相應的建議。
關鍵詞:集裝箱 吞吐量 ARIMA模型
中圖分類號:F5 文獻標識碼:A DOI:10.3969/j.issn.1672-0407.2013.03.003
一、研究背景
集裝箱是由美國人在1921年發明并使用的,最早是用在鐵路上。由于其運輸量大,易裝卸,節約環保等優點,隨著時間的發展,已經成為當今海運最重要的運輸方式。
港口集裝箱吞吐量是反映港口生產經營活動成果的重要數量指標,港口集裝箱吞吐量的流向構成、數量構成和物理分類構成是港口在國際、地區間水上交通鏈中的地位、作用和影響的最直接體現,也是衡量國家、地區、城市建設和發展的量化參考依據。對集裝箱吞吐量進行預測是確定港口發展規模,規劃港口總體布局,劃分港區功能的重要依據之一,是港口規劃中首要的前期工作。吞吐量預測的不正確,將會導致規劃決策的失誤,從而給港口帶來經濟損失,甚至會影響城市、地區、全國經濟的發展。因此,對上海港集裝箱吞吐量進行分析研究,將為其未來的發展、相關部門制定正確的決策提供理論指導。
在吞吐量預測模型的構建中有很多方法,如時間序列模型,神經網絡模型,logistic模型等,其中時間序列模型是公認精度較高的模型。
二、模型簡介
Arma模型是由G.E.P.Box和G.M.Jenkins創立在20世紀70年代創立,并在80年代中后期得到發展。由于在現實世界中,無論是自然科學和社會科學,存在很多重要的時間序列,分析時間序列的關系可以使我們更好的了解事物的發展規律。現在時間序列的分析方法大致分為兩種:一、利用外部的因素對目標序列做出解釋,例如線性回歸,指數回歸等。在外部指標容易得到時,這種方法適用,但現實中,往往缺乏相應的外部因素數據來支持人們的研究,同時人們在確定外部數據時,會認為的決定數據的選取,即使二者關系不大,從而使結果缺乏客觀性。二、當外部因素數據不易確定時,可以運用序列的歷史數據,根據其曾經的行為來判斷未來的走勢。如Arma模型。
Arma可以根據實際應用分為三個模型:
1.AR模型(自回歸模型);通過把當期數據用它的前p期數據線性表示,P是階數,即AR(p),一般可表示為:
X1=?椎1Xt-1+?椎2Xt-2+…+?椎pXt-p+?滋t (1)
式中,Xt為時間序列,?椎i(i=1,2,……p)為待估計的自回歸系數,?滋t為誤差項。引入滯后算子B,Bk=Xt/Xt-k,
且令?椎(B)=1-?椎1(B)-?椎2(B)2-…-?椎p(B)p,則(1)式可以簡寫為:
?椎(B)Xt=?滋t (2)
2.MA模型(移動平均模型);通過把當期數據的隨機誤差用它的前p期數據的隨機誤差線性表示,P是階數,即MR(p),一般可表示為:Xt=?滋t-?茲1?滋t-1-?茲2?滋t-2-…-?茲q?滋t-q (3)
式中,?茲1(i=1,2,……,q)為待估計的移動平均系數。
引入滯后算子B,Bk=?滋t/?滋t-k,
且令?茲(B)=1-?茲1B-?茲2B2-…-?茲qBq則(3)式可以簡寫為:
Xt=?茲(B)?滋t (4)
3.ARMA模型(自回歸移動平均模型);通過把當期數據和隨機誤差用它的前p期數據和隨機誤差線性表示,P是階數,即ARMA(p),一般可表示為,
Xt=?椎1Xt-1+?椎2Xt-2+…+?椎pXt-p+?滋t-?茲1?滋t-1-?茲2?滋t-2-…-?茲q?滋t-q (5)
引入滯后算子B,則(5)式可以簡寫為:
?椎(B)Xt=?茲(B)?滋t(6)
三、建模步驟
1.一般的現實生活中的時間序列都不平穩,因此,首先通過觀察樣本自相關系數(ACF)和樣本偏自相關系數(PACF)的值以及分析其穩定性,對模型進行識別。
2.運用差分對非平穩序列進行處理,根據ACF和PACF,選擇階數適當的ARMA(p,q)模型進行擬合。
3.估計模型中的位置參數的值,并檢驗其是否具有統計意義。
4.檢查殘差序列是否為白噪聲序列。
5.利用通過檢驗的擬合模型,對序列的走勢進行預測。
四、數據處理
通過左側的自相關系數圖,可以看出自相關系數并沒有很快落入隨機區間,趨近于0.所以該序列不穩定,ARIMA模型要求穩定的序列,因此我們做一階差分來消除序列的趨勢,以使其達到穩定。
由圖二可以看出,通過一階差分序列趨勢基本消除,但k=12,k=24時自相關系數大大超出了隨機區間的范圍,仍然具有很強的季節波動性。包含季節性的時間序列也不能運用ARMA模型。因此我們對序列做一階季節差分,如圖3。
序列經過一階季節差分后,季節性仍沒有改觀,我們嘗試二階季節差分,發現改進不明顯,所以只做一階季節差分。我們對序列進行平穩性檢驗如圖4所示。
可以得出在顯著水平為1%的情況下,序列是穩定的。
五、構建模型
對ARMA模型建模要參照自相關系數和偏相關系數,原始序列經過一階差分和一階季節差分后的自相關系數和偏相關系數如圖三所示。經過差分后,序列仍具有較強的季節性,我們考慮使用ARIMA季節乘積模型,ARIMA(p,d,q)×(P,D,Q)s。需要為ARIMA模型定階,如果自相關系數p階截尾則,模型為MA(p),如果偏相關系數q階截尾,則模型為AR(q)。如果自相關系數和偏相關系數都拖尾,則可采用ARMA模型。由圖三知自相關系數在k=2時顯著不為0,所以取q=1或2,偏相關系數在k=1時顯著不為0,所以取p=1,序列進行了一階差分和一階季節差分,所以d=1,D=1。P和Q不容易確定,但P,Q取值一般不超過2,則共有18種可能的模型。
列舉經檢驗得到:
ARIMA(0,1,1)×(1,1,1)12, AIC=7.427198, SC=7.553864在各個模型中最小,R2=0.760631在各個模型最大。其自回歸方程AR的差分方程對應的特征根和移動平均部分MA所對應的特征根都在單位圓內,所以模型滿足穩定性和可逆性。
如圖6所示通過對殘差值的Q檢驗,其殘差值序列是白噪聲序列,即對序列信息提取的比較充分。上海港務集團吞吐量預測模型為:
(1-B)(1-B12)(1+1816×B12)Xi=(1+1.4798×B)(1+0.9366×B12)ei
Xi為集裝箱吞吐量序列,ei為殘差值序列。
六、預測
根據ARIMA(0,1,1)×(1,1,1)12得到的趨勢圖,可以看出較為擬合,預測結果與實際較為擬合,具有一定的參考價值。
據此對上海港務集團2012年6月至2012年5月的集裝箱量進行預測。
2011年6月-2012年5月集裝箱吞吐量預測數據
Jun-11 Jul-11 Aug-11 Sep-11 Oct-11 Nov-11
249.7744 269.5455 267.1196 259.7901 251.4404 252.0324
Dec-11 Jan-12 Feb-12 Mar-12 Apr-12 May-12
251.4491 249.5184 200.6484 257.0075 255.4618 265.4057
單位萬TEU