劉宇璐,陳冬林
(1.普渡大學,美國 47907;2.武漢理工大學經濟學院,武漢 430063)
基于ARIMA模型的武漢港貨物吞吐量預測研究
劉宇璐1,陳冬林2
(1.普渡大學,美國 47907;2.武漢理工大學經濟學院,武漢 430063)
本文結合武漢港口貨物吞吐量周期性、波動性及非線性變動趨勢特征,選取能夠較好地揭示周期性數據在變化過程中的非線性特征的ARIMA模型,構建了武漢港貨物吞吐量的ARIMA預測模型;最后采用武漢港2013-2015年歷史數據驗證該模型的有效性和穩定性,并將預測結果相對誤差控制在10%以內;同時運用該模型對2016-2017年港口吞吐量作出預測及分析。
武漢港;貨物吞吐量;ARIMA模型;時間序列分析;預測
DOI編碼:10.13646/j.cnki.42-1395/u.2016.10.016
作為港口規劃和運營決策的重要依據,港口吞吐量是量化衡量港區生產經營成果乃至地區建設發展現狀的關鍵指標。武漢港作為“長江經濟帶”上的重要口岸,不僅是湖北經濟發展的支點,在國家中部崛起戰略、長江黃金水道和武漢航運中心建設中地位也極為重要。其貨物吞吐量預測對武漢港未來運營發展、規劃建設、資源開發等的優化和資源配置有重要作用。
目前,針對港口吞吐量的研究主要集中于對港口吞吐量影響因素的研究以及對港口吞吐量的預測方法研究。預測方法包括回歸分析、指數平滑、神經網絡、灰色系統理論及組合預測方法等。Chen TT采用BP神經網絡建立三層網絡對南京港吞吐量做出預測;。邵志強采用修正的GM(1,1)模型對港口吞吐量進行預測。劉晨曦等建立基于灰色預測、平滑技術、BP神經網絡加權建立組合預測模型,提高預測能力;石勇等通過分析港口吞吐量的因素分析,建立了基于BP神經網絡的預測模型對武漢市港口吞吐量進行預測。JR Marks提出了一種新的方法來預測港口群的總吞吐量,以層次分析法來預測港口群的總吞吐量。
但在實際情況中,港口吞吐量受經濟、社會、環境、政策等因素相互影響,港口吞吐總量同時包含有明顯的線性因素和周期性的特點。上述方法在處理周期性問題上都有一定局限性,無法全面準確揭示其吞吐總量變化的特征。而以自回歸求積移動平均(Auto-Regressive Integrated Moving Average Model,ARIMA)模型為代表的時間序列預測則能克服這一局限,近年在解決港口吞吐量預測問題中受到研究者的廣泛關注。辛曼玉針對航海港口歷史數據線性和非線性結合的特點,構建了ARIMA和RBF組合預測模型對福建港口貨物吞吐量進行了預測。王艷建立ARIMA乘積季節模型來反映港口集裝箱吞吐量的時間序列變化規律[9]。以上海港2002~2009年集裝箱吞吐量為例,建立了ARIMA(0,1,1)×(0,1,1)12乘積季節模型,結果表明該乘積季節模型的預測精度較高[10]。
針對武漢港屬于建設初期,吞吐量周期性不明顯,且呈現波動較大,非線性的特點,而與常用的線性回歸預測模型相比,ARIMA能夠較好地揭示周期性數據在變化過程中的非線性特征,消除周期性變化對數據預測的影響,提高時間序列數據的預測精度。本文根據武漢港歷年吞吐量數據的特點,針對其線性特征與非線性周期特征并存的問題,擬用ARIMA模型分別建立武漢港港口貨物吞吐總量及外貿貨物吞吐量預測模型,對其中短期發展趨勢進行精確預測。
武漢港是中國內河通往沿海最大的啟運港及到達港,轄漢陽、漢口、陽邏、沌口、青山、左嶺等港區,是交通部定點的水鐵聯運主樞紐港,擁有與上海洋山港相連的首條長江中上游通江達海優質航線,陽邏港區也是國內是唯一試行啟運港退稅政策的長江沿線港口。武漢港作為“長江經濟帶”上的重要口岸,不僅是湖北經濟發展的重要支點,在國家中部崛起戰略、長江黃金水道和武漢航運中心建設中地位也極為重要。目前,武漢全市共有119家地方水運企業,357艘各類貨運船舶、實際運力超過150萬載重噸。但武漢航運企業單船公司現象普遍,全市范圍內有22家單船公司,而運力規模超過10萬載重噸的僅有3家。本節將在分析武漢港月總貨物吞吐量和月外貿貨物吞吐量變化特點的基礎上,構建武漢港貨物吞吐量的ARIMA預測模型,研究未來兩年貨物吞吐量的發展趨勢,為武漢港的管理和規劃提供數據支撐。
武漢港月總貨物吞吐量和月外貿貨物吞吐量(2003年01月至2015年12月)的變化情況如表1和表2所示(具體數據見附件),受國內外環境、社會因素和長江水位周期等多種因素的影響,貨物吞吐量隨時間的變化呈現周期性變化,但仍然具有不確定性、復雜性和非線性等特點。

圖1 武漢港月總貨物吞吐量變化曲線圖

圖2武漢港月外貿貨物吞吐量變化曲線圖
圖1和圖2更加清晰地刻畫了武漢港月總貨物吞吐量和月外貿貨物吞吐量在2003年01月至2015年12月的發展趨勢。吞吐量的變化受多種因素的影響,但總體上有著波動上升的趨勢。同一年中,貨物吞吐量總體隨時間呈上升趨勢;與往年同期相比,貨物吞吐量大體上有著持續增長的規律。
ARIMA模型是由Box-Jenkins于1970年在隨機理論基礎上提出的一種時間序列分析方法,能夠充分利用歷史數據中蘊含的自相似性與周期性特點,已被廣泛地應用于經濟學領域。ARIMA模型能夠在自回歸項(Autoregressive,AR),單整項和移動平均項(Moving Average,MA)的基礎上對數據擾動項進行建模分析,以實現在預測過程中同時考慮時間序列數據的過去值、當前值和誤差值,達到提高數學模型的預測精度。ARIMA(p,d,q)本質上是經d階差分后的ARMA(p,q)模型,其中p為自回歸模型的階數,q為移動平均的階數。對于時間序列,經過d次差分后可假設為平穩序列,即

其中,B為后移算子。此時,可得到ARMA(p,q)模型的數學表達公式為

其中,為可加性高斯白噪聲。在此基礎上,我們構建的用于預測武漢港月總貨物吞吐量與月外貿貨物吞吐量變化趨勢的ARIMA模型的建模步驟分為4步:
第一步:檢驗時間序列的平穩性。如果原始時間序列不滿足平穩性條件的要求,需通過差分變換或對數差分變換使其滿足平穩性序列的要求。
第二步:模型結構辨識。利用最小信息準則(AIC)和相合性準則(SBC)的方法來計算ARIMA(p,d,q)模型中階數p和q。
第三步:模型參數估計。在歷史數據基礎上通過求解相應方程來計算預測模型中變量的系數。
第四步:預測模型檢驗。通過分析真實數據與預測數據之間的相對誤差來檢驗預測模型的有效性。若模型檢驗不能通過,則需返回到第二步重新進行模型結構辨識。
第五步:預測模型應用。利用所建立的ARIMA模型用于預測武漢港貨物吞吐量未來的發展趨勢。
為驗證ARIMA模型在港口貨物吞吐量預測研究中的有效性,文章以武漢港月總貨物吞吐量與外貿吞吐量在2003年01月至2015年12月的歷史數據為研究對象。該模型對原時間序列的預測結果分別如圖3和圖4所示。從圖中可看出,本文ARIMA模型預測得到的結果絕大多數情況下能夠很好地逼近真實值,相應的預測相對誤差如圖5和圖6所示。在相對誤差分析圖中,月總貨物吞吐量的預測相對誤差絕大多數在4%以內,月外貿貨物吞吐量的預測對象誤差大多在10%以內,體現了本文所構建預測模型在處理實際問題時的有效性與精確性。

圖3 武漢港月總貨物吞吐量預測擬合效果圖

圖4 武漢港月外貿貨物吞吐量預測擬合效果圖

圖5 月總貨物吞吐量預測相對誤差(%)統計直方

圖6 月外貿貨物吞吐量預測相對誤差(%)統計直方圖
相比總貨物吞吐量,外貿貨物吞吐量更易受國內外政策和環境等多因素的影響,預測存在更強的不確定性和復雜性,其預測精度不可避免地略低于總貨物吞吐量,但總的預測結果仍然能夠滿足實際問題的需求。2016年01月至2017年12月,總貨物吞吐量和外貿貨物吞吐量的預測結果如圖3和圖4后半段數據所示。預測結果與歷史數據有著類似的波動性,能夠較好地刻畫季節和環境的變化對貨物吞吐量的影響,具體結果如表3所示。從表中可看出,與2016年同期相比,2017年各月的總貨物吞吐量與外貿吞吐量在大多數情況下呈顯著的上升趨勢,這與持續快速發展的武漢市經濟有著類似的變化規律,從側面驗證了本文所構建的ARIMA模型能夠用來預測武漢港貨物吞吐量未來的發展趨勢。

表1 2016年1月至2017年12月貨物吞吐量預測結果(單位:萬噸)
由上述預測結果可知,未來幾年武漢港貨物吞吐量總量基本處于穩定,這與長江航運未來重點發展旅游客船的定位基本一致。但是,由于武漢港地處長江中游,枯水期和洪水期等自然條件對航運影響大,自然條件的季節性特點突出,2016和2017年的預測結果體現了貨物吞吐量的季節性波動,11-3月(枯水期)貨物吞吐量明顯少于4-10月(洪水期),這樣的季節波動特點必然導致枯水期船舶裝載率明顯小于洪水期,大大降低船舶裝載率的發揮,也不利用長江船型標準化。
武漢港貨物吞吐量受國內外環境、社會因素和長江水位周期等多種因素的影響,其變化具有不確定性、復雜性和非線性等特點。本文在分析武漢港貨物吞吐量的變動趨勢特征的基礎上,選取能夠反映武漢港貨物吞吐量波動性較大且非線性特征的ARIMA模型對武漢港貨物吞吐量進行建模并預測。結果表明該模型具有很強的非線性擬合能力,在月總貨物吞吐量的預測相對誤差絕大多數在4%以內,月外貿貨物吞吐量的預測對象誤差大多在10%以內,提高了預測精度和穩定性;同時2016年1月至2017年12月的預測結果也與客觀事實基本一致。ARIMA模型能夠為港口規劃、設計和管理提供基礎性依據,也可為長江干線其他港口的貨物吞吐量預測研究提供數據支撐。
[1]蘇建國,夏飛.武漢航運業現狀及發展建議[J].中國水運,2014,8:22-23.
[2]《關于依托黃金水道推動長江經濟帶發展的指導意見》http://www.gov.cn/zhengce/content/2014-09/25/content_9092. htm
[3]劉晨曦,王頌翔,韓壯,程楠.基于組合預測算法的武漢港貨物吞吐量預測體系[J].中國信息化,2012,16:259-260.
[4]邵志強.基于灰色預測模型的港口集裝箱吞吐量預測:以武漢港為例[J].港口經濟,2010,12:39-42.
[5]Chen T T,Chen Y Y.Port Cargo Throughput Forecast Based on BP Neural Network[J].Computer&Modernization,2009.
[6]石勇,殷惠.基于BP神經網絡的武漢港貨物吞吐量預測[J].中國水運,2007,10:39-40.
[7]Marks J R,Placone J,Hristova K,et al.Spontaneous Membrane-Translocating Peptides by Orthogonal High-Throughput Screening[J].Journal of the American Chemical Society,2011,133(23):8995-9004.
[8]史曉丹.基于粗糙集與遺傳規劃的港口吞吐量預測研究[D].北京交通大學,2014.
[9]辛曼玉.基于ARIMA-RBF神經網絡的沿海港口吞吐量預測研究[J].武漢理工大學學報(交通科學與工程版),2014,38(1): 241-244.
[10]陶麗麗,王艷.基于ARIMA乘積季節模型的港口集裝箱吞吐量預測[J].運籌與模糊學,2015,5(2):30-37.
[11]薛俊強.寧波港集裝箱吞吐量預測模型的選擇[J].華東經濟管理,2013,5:1007-5097.
[12]喬文軒.上海港務集團集裝箱吞吐量預測分析[J].南北橋(人文社會科學學刊),2013,3:3-4.
[13]曹金亮.寧波:舟山港貨物吞吐量預測方法[J].浙江海洋學院學報(自然科學版),2013,32(1):60-66.
[14]Williams,B.,Durvasula,P.,Brown,D.Urban freeway traffic flow prediction:application of seasonal autoregressive integrated moving average and exponential smoothing models[J].Transportation Research Record,1998,1644:132-141.
[15]韓超,宋蘇,王成紅.基于ARIMA模型的短時交通流實時自適應預測[J].系統仿真學報,2004,16(7):1530-1535.
F552
A
1006—7973(2016)10-0045-03
國家自然科學基金資助項目(71172043).