余國剛,馮 琪,徐 粉(武漢理工大學 交通學院,湖北 武漢 430063)
張家港永嘉集裝箱碼頭集裝箱吞吐量組合預測
余國剛,馮 琪,徐 粉
(武漢理工大學 交通學院,湖北 武漢 430063)
應用灰色預測模型、二次指數平滑法、BP神經網絡預測模型等單項預測方法分別對張家港永嘉集裝箱碼頭集裝箱吞吐量進行預測,基于方差倒數法求取每個單一模型的權重,并構建組合預測模型。選擇預測誤差最小的組合預測模型對集裝箱吞吐量進行預測,得出2016年和2017年的集裝箱吞吐量預測值。
張家灣永嘉集裝箱碼頭;集裝箱吞吐量;灰色預測;二次指數平滑;BP神經網絡;組合預測
隨著世界經濟一體化和經濟全球化的持續發展,世界各地區港口集裝箱運輸發展十分迅猛,面對廣闊的發展前景和巨大的發展潛力,港口應正確把握集裝箱運輸發展態勢,抓住機遇加快集裝箱運輸的建設和發展,因此對港口集裝箱運輸的發展狀況進行科學合理的預測,是國家、政府和企業進行集裝箱運輸建設投資、發展港口集裝箱運輸的重要決策依據。學者孫永明等[1]建立灰色GM(1,1)模型,對上海港貨物吞吐量進行短期預測研究;黃順泉[2]通過比較分析指數平滑法和回歸分析法,對上海港集裝箱吞吐量進行預測研究;陳婷婷等[3]建立了三層BP神經網絡模型對南京港貨物吞吐量進行預測;翟希東[4]在神經系統的相關理論和灰色理論的基礎上建立了組合預測模型,得到了較好的預測結果,為集裝箱港口的建設與規劃提供了合理的決策依據。
張家港永嘉集裝箱碼頭作為張家港港口的一個重要組成部分和上海組合港的重要成員,多年來集裝箱吞吐量連續增長,對永嘉集裝箱碼頭集裝箱吞吐量進行預測分析,對企業自身而言,有利于公司整合資源,調整集裝箱運輸發展策略,提高碼頭競爭力和經濟效益;對政府而言,有利于把握港口集裝箱發展規模,為制定相關政策提供依據。本文運用多種預測方法,通過比較預測精度,確定出最優組合模型,并對其2016年、2017年集裝箱吞吐量進行預測。
在選擇集裝箱吞吐量預測方法時應考慮以下幾點影響因素:
(1)永嘉集裝箱碼頭歷年集裝箱吞吐量存在著一定的變化規律,且符合時間序列法的特點。
(2)永嘉集裝箱碼頭有限公司成立于1992年,距今僅二十多年,其相關統計數據還不健全。
(3)港口是一個復雜的系統,是一個城市貨物集散的物流中心,集裝箱吞吐量的發展受多方面因素的影響,包括國家宏觀經濟水平、地區經濟發展水平、外貿進出口總額、其他運輸方式運量等。
經分析,本文采用組合預測方法,單項預測模型為灰色預測模型、二次指數平滑法和BP神經網絡預測模型,根據單項模型建立組合預測模型,通過分析、比較,確定最優的組合預測模型。
張家港永嘉集裝箱碼頭吞吐量增長迅猛,其1998-2015年集裝箱吞吐量數據見表1。

表1 永嘉集裝箱碼頭1998-2015年集裝箱吞吐量(單位:萬TEU)
3.1 灰色預測模型GM(1,1)
灰色預測模型簡稱GM預測模型,是通過少量的、不完全的信息,用微分擬合法建立數學模型并做出預測的一種預測方法。灰色預測模型的短期預測結果具有較高的可信度,但是由于其數據量小和信息不完整的缺陷,對于長期預測結果的可信度有所下降。
(1)基本原理
①建模可行性判斷。首先判斷時間序列是否適合作為GM(1,1)建模序列。對于給定的時間序列X(0)= {x(0)(1),x(0)(2),...,x(0)(n)},計算級比:

②數據預處理。采用平移處理方法對數據進行處理,處理后數據滿足高精度建模序列的要求,即可在原始序列的每一項加一個常數Q,則有:

③GM(1,1)模型建立。令X(0)={x(0)(1),x(0)(2),...,x(0)(n)} 為GM(1,1)建模序列,通過累加生成新序列X(1)={x(1)(1), x(1)(2),…,x(1)(n)},模型相應的微分方程為:

式中,a為發展灰數,μ為內生控制灰數。
④參數估計。設a∧為待估參數向量,α∧=,可利用最小乘法求解,即得:

求解微分方程,即可得預測模型:

(2)利用灰色模型預測永嘉集裝箱碼頭集裝箱吞吐量
選用永嘉集裝箱碼頭2004-2014年數據建立灰色預測模型,經過序列的級比計算發現需要對數據進行預處理,在原始序列的每一項加一個常數Q=100,生成新的數列,新序列的級比已全部落在δ(k)的覆蓋范圍內,符合灰色預測的要求。
經計算,得到:a=-0.068 4,μ=122.794 2,據此得到GM(1,1)預測模型:

根據式(6)進行計算,計算值進行累減并減去常數Q即為集裝箱吞吐量預測值,2011-2015年吞吐量預測數據與實際值的檢驗分析結果見表2。
3.2 二次指數平滑預測模型
指數平滑法是在移動平均法基礎上發展起來的一種時間序列分析預測法,它是通過計算指數平滑值,配合一定的時間序列預測模型對現象的未來進行預測,它對時間序列的隨機性和波動性考慮較少。由于永嘉集裝箱碼頭集裝箱吞吐量的變化趨向于二次指數平滑變化規律,故本文采用二次指數平滑預測。

表2 灰色預測法預測2011-2015年集裝箱吞吐量檢驗分析
(1)基本原理
①二次指數平滑模型的建立。設時間序列為:x1,x2,x3,...,xn;用S表示指數平滑值,即第t期、第i次指數平滑值記為St(i),指數平滑值計算公式為(α為平滑系數,且0<α<1):

對預測周期為T年、基年為第t年的指標預測值,其二次指數平滑法的預測模型為:

式中:at,T為預測周期,at、bt為平滑系數。
②平滑初始值的確定。應用二次指數平滑法進行預測時,須首先估算初始值、,根據經驗取前3個數據的平均值作為一次指數平滑的初始值,即:

③α值的確定。采用指數平滑法預測,如果數據波動不大,α宜取小值(0.1-0.3),這樣可以使各期觀察值的權數由近及遠緩慢地變小;如果數據波動較大,α宜取大值(0.6-0.8),這樣可以加重近期觀測值的權數,使各期觀察值的權數由近及遠較快地變小。但是,在多數情況下α值并不易判斷,為準確起見,可分別選用不同的α值試算。
指數平滑法的預測誤差可以用均方差法(MSE法)測定,計算公式為:

式中yi為實際值為預測值。對于α值的選定,應以測試數據的預測誤差值最小即MSE最小為原則,從中選取較好的α值。
(2)利用二次指數平滑法預測永嘉集裝箱碼頭集裝箱吞吐量
選用永嘉集裝箱碼頭2004-2014年數據建立二次指數平滑測模型。經反復檢驗,最后確定當α=0.8時計算出來的方差最小,最小方差MSE=11.890 0,進而得到預測方程為:

其中(t=1,2,...,n)為預測年份,Y為集裝箱吞吐量。
根據式(11)對集裝箱吞吐量進行預測,預測數據與實際值的檢驗分析結果見表3。

表3 二次指數平滑法預測2011-2015年集裝箱吞吐量檢驗分析
3.3 BP神經網絡預測模型
人工神經網絡是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型,是用大量簡單的單元構成的非線性系統,模仿人腦神經網絡的結構與功能特征的一種技術系統,是大規模并行的非線性動態系統,具有學習、記憶、計算及智能處理的功能。與指數平滑法、曲線擬合法等方法相比,人工神經網絡本身具有一些特性,使其較好的實現了對非線性復雜系統的預測。
GDP、對外貿易額、第一產業產值、第二產業產值、第三產業產值、貨運量、水路貨運量對于張家港永嘉集裝箱碼頭集裝箱吞吐量有極其重要的作用,本文選取1992年-2015年的影響因素統計資料,把它們作為BP神經網絡的輸入值,2011年-2015年的貨物吞吐量作為輸出值。1992年-2015年的影響因素統計資料見表4、表5。
BP神經網絡預測具體步驟如下:
(1)數據預處理。將各影響因素統計值與吞吐量統計值進行歸一化處理,使其數值在0-1之間。


表4 集裝箱吞吐量影響因素統計表(1)

表5 集裝箱吞吐量影響因素統計表(2)
其中,Xi為原始數據,Yi為預處理后的數據,是根據實際情況取得的小于數據中最大值的數值。
(2)樣本的選取。本文用前十年的影響因素作為網絡的輸入值,第十一年集裝箱吞吐量作為輸出值。首先將1991年-2000年的影響因素作為訓練樣本的第一次輸入,將2001年的集裝箱吞吐量作為第一次輸出,依此類推,得到14個樣本,選取前10個樣本為訓練樣本,后4個作為測試樣本。
(3)網絡參數設置。設定最大訓練次數為10 000、訓練精度為0.000 000 1。對于隱含層神經元個數的確定,本文采用的是試探法。首先用經驗公式來確定大致范圍,然后從隱含層神經元個數少的網絡開始訓練,逐漸增加節點數目,并且分析每次結果的誤差,如果誤差沒有因節點的增多而增大,此時的神經元個數可以認為是理想的。
其中,輸入層節點數m=50,輸出層節點數n=1,C為1-10的節點數。
經過計算與訓練,確定隱含層神經元個數為16時,訓練次達到7 365次時達到設定的目標誤差,訓練結果如圖1所示。

圖1 神經網絡訓練結果圖
(4)選擇后四個樣本作為檢驗樣本,要求輸出值與實際值誤差在1.5%以內。分別將影響因素數據作為輸入,輸出2011年-2015年集裝箱吞吐量,并檢驗精度是否達到要求。
經過計算與調試,達到預測精度要求時,用2011 年-2015年數據進行檢驗,檢驗結果見表6所示。
3.4 組合預測模型
組合預測是通過對單項預測模型進行組合來盡可能地提高預測精度的預測方法,研究表明,在諸多單項預測模型各異且數據來源不同的情況下,組合模型的預測結果比任何一個單一模型的預測精度都高,組合預測模型具有減少預測系統誤差,顯著改善預測效果的作用。

表6 預測2011-2015年集裝箱吞吐量檢驗分析
為了能充分利用以上三種模型的優點,有必要將它們進行組合。組合預測的關鍵是確定加權系數,可以根據不同的理論確定不同的計算方法,本文采用方差倒數法即預測誤差平方和來確定加權系數。預測誤差平方和是反映預測精度的一個指標,預測誤差平方和越大,表明該預測模型的精度越低,從而它在組合預測中的重要性就越低,重要性的降低表現為它在組合預測模型的組合預測中應賦予較小的加權系數。
(1)基本原理。設Y為預測對象的各種預測方法,則最優綜合模型為:

其中Qi=,式中Qi分別為預測方法在綜合模型中的權重,Di為每種預測方法的誤差平方和。
(2)組合模型的建立。基于以上所建立的三個單一模型,可以建立四種不同的組合模型,分別為灰色預測法與二次指數平滑法所建立的組合模型一;灰色預測法與BP神經網絡預測模型所建立的組合模型二;二次指數平滑法與BP神經網絡預測模型所建立的組合模型三;灰色預測法、二次指數平滑法與BP神經網絡預測模型所建立的組合模型四,見表7。
3.5 基于最優組合模型的集裝箱吞吐量預測
由表7可知,三個單項模型中灰色模型和BP神經網絡模型的預測精度較高,而指數平滑模型預測結果相對較差。通過比較單項模型和組合模型的預測結果可以看到,組合模型明顯提高了預測精度。而各種組合之間的比較表明,組合模型四預測誤差最小,最小誤差為0.733 2%,因此選擇綜合模型四作為永嘉集裝箱碼頭集裝箱吞吐量的預測模型。

表7 三個單一模型和四個組合模型
根據已建立的單一模型和組合模型四,對永嘉集裝箱碼頭2016年和2017年吞吐量預測,預測結果見表8。

表8 永嘉集裝箱碼頭2016年-2017年集裝箱吞吐量預測(單位:萬TEU)
由表8可知,2016年永嘉集裝箱碼頭集裝箱吞吐量為188.48萬TEU,2017永嘉集裝箱碼頭集裝箱吞吐量為207.53萬TEU。
[1]孫永明,鄭光平.基于灰色理論的港口吞吐量預測研究[J].中國水運,2007,5(4):160-162.
[2]黃順泉.關于港口吞吐量預測方法選擇的探討[J].集裝箱化, 2003,(7):17-18,28
[3]陳婷婷,陳漪翊.基于BP神經網絡的港口貨物吞吐量預測[J].計算機與現代化,2009,(10):4-5,9.
[4]翟希東.港口集裝箱吞吐量預測模型研究[D].大連:大連理工大學,2006.
Combination Forecasting of Container Throughput of Zhang jiagang Yongjia Container Port
Yu Guogang,FengQi,Xu Fen
(SchoolofCommunication,Wuhan University of Technology,Wuhan 430063,China)
In this paper,we used the grey forecasting model,second exponential smooth method,BP neural network forecasting model, etc.,to forecast the container throughput of the ZhangjiagangYongjia container port respectively,then based on the inverse variance method, obtained the weight of each model to build the combination forecasting model,and at the end,after identifying and using the combination forecasting model with the least forecasting error to forecast the container throughput of the port,arrived at the forecast container throughput of theportfor 2016 and 2017.
Zhang jiagang Yongjia container port;container throughput;grey forecasting;second exponential smooth;BP neural network;combination forecasting
U169.6;F224.0
A
1005-152X(2017)04-0103-05
2017-02-16
余國剛,男,武漢理工大學學術型碩士,研究方向:交通運輸規劃與管理。
doi∶10.3969/j.issn.1005-152X.2017.04.024