王振振, 萇道方, 朱宗良, 羅 天
(上海海事大學(xué) 物流科學(xué)與工程研究院, 上海 201306)
隨著“一帶一路”新型經(jīng)濟帶的提出,我國海運業(yè)發(fā)展日益蓬勃,集裝箱運輸方式已成為海洋運輸?shù)臉?biāo)志。與此同時港口作為“一帶一路”的重要節(jié)點,在“一帶一路”建設(shè)中有著舉足輕重的作用,港口集裝箱吞吐量不僅是港口地區(qū)經(jīng)濟發(fā)展的晴雨表,更標(biāo)志著一個港口在國際經(jīng)濟貿(mào)易中的地位。[1]因此,利用有效的數(shù)學(xué)方法對港口集裝箱吞吐量進行精準預(yù)測,是對港口未來的規(guī)劃發(fā)展做出科學(xué)決策的重要前提。
自20世紀80年代起,關(guān)于港口集裝箱吞吐量預(yù)測方面的研究很多,國內(nèi)外學(xué)者提出多種預(yù)測方法,如時間序列預(yù)測法[2-3]、TEI@I方法論[4]、灰色模型法[5-6]、支持向量回歸機法[7]、神經(jīng)網(wǎng)絡(luò)法[8]和組合模型法[9-11]等。一方面大部分單一模型的預(yù)測精度較低,而組合模型建模求解過程較復(fù)雜,在實際應(yīng)用中難以發(fā)揮理想效果;另一方面,大部分文獻集中于研究年度集裝箱吞吐量預(yù)測,沒有對季度數(shù)據(jù)進行統(tǒng)計分析,無法準確地掌握港口集裝箱吞吐量的季度發(fā)展規(guī)律,僅有少量文獻考慮月度數(shù)據(jù),但沒有深入分析各月份吞吐量對總體吞吐量的影響程度。與以往的研究相比,本文的做法:首先用加權(quán)灰色關(guān)聯(lián)分析對各季度影響總體吞吐量的程度進行排序;然后利用三次指數(shù)平滑法對該港口集裝箱季度吞吐量進行初值預(yù)測,并結(jié)合馬爾科夫模型修正初值,改善其對轉(zhuǎn)折點的不適應(yīng)所造成的誤差,提高預(yù)測精度;最后與傳統(tǒng)三次指數(shù)平滑法和灰色模型法的預(yù)測結(jié)果進行對比,充分證明所提組合模型的預(yù)測效果更好,可為港口經(jīng)營發(fā)展提供決策支持。
設(shè)X={xσ|σ=0,1,2,…,m}為序列關(guān)聯(lián)因子集,X0為參考函數(shù),Xi為比較函數(shù),xσ(k)為xσ在第k點的值,其中k=1,2,3,…,n。
設(shè)x=(x(1),x(2),x(3),…,x(n))的累減生成序列為
x′=(x′(1),x′(2),x′(3),…,x′(n))
(1)
其計算方法為
x′(1)=x(1),x′(k)=x(k)-x(k-1),k=2,3,…,n
(2)
對于x0、xi
令
(3)
式(3)中:ζi(k)為關(guān)聯(lián)系數(shù),即第k時刻比較曲線xi對于參考曲線x0的相對差值;兩個層級的最大差為maxi∈mmaxk∈n|x0(k)-xi(k)|;ε為分辨系數(shù);λ1為位移加權(quán)系數(shù);λ2為變化率加權(quán)系數(shù),均取0.5。ε取值過大或過小都可能導(dǎo)致相關(guān)參數(shù)產(chǎn)生誤差,最終影響模型的準確度。許多文獻表明:ε較為合理的取值為0.5或0.6,此時不僅計算簡單,而且可信度較高,本文取ε= 0.5。[12]
xi對于x0的加權(quán)灰色關(guān)聯(lián)度γi為
(4)
式(4)中:βk為因子k常態(tài)化的權(quán)重系數(shù),通過白化權(quán)函數(shù)來確定[12],過程如下:
設(shè)白化權(quán)函數(shù)為
f(x)=xe1-x+(1-x)ex-1
(5)
已知序列為
xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),
i=1,2,…,n
(6)
1) 求各序列中屬性因子總和為
(7)
2) 求因子熵為
(8)
3) 求熵總和為
(9)
4) 求相對權(quán)重為
(10)
5) 利用正規(guī)化法求各因子權(quán)重為
(11)
選取深圳港2012—2017年各季度集裝箱吞吐量數(shù)據(jù)見表1,對其進行季度灰色加權(quán)關(guān)聯(lián)分析,旨在找出該港口集裝箱季度吞吐量發(fā)展變化規(guī)律。
設(shè)該港口每年的集裝箱吞吐量為參考序列如下:
x0=(2 101.69,2 096.70,2 401.77,2 369.78,
2 283.23,2 460.49)
(12)
不同季度對應(yīng)的集裝箱吞吐量為比較序列xi(i=1,2,3,4),由式(3)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的關(guān)聯(lián)系數(shù)矩陣為

(13)
式(13)中:ξ1、ξ2、ξ3、ξ4分別為第一、第二、第三、第四季度的關(guān)聯(lián)系數(shù)。
通過上述白化權(quán)函數(shù)求得各因子權(quán)重為β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165,由式(2)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的加權(quán)關(guān)聯(lián)度為

表1 深圳港2012—2017各季度集裝箱吞吐量 萬TEU
(14)
式(14)中:γ1、γ2、γ3、γ4分別為第一、第二、第三、第四季度的關(guān)聯(lián)度。
由式(14)可知:γ3>γ4>γ2>γ1,即第三季度與年度總數(shù)的關(guān)聯(lián)度最大,其次是第四季度、第二季度,這兩個季度的影響度接近,關(guān)聯(lián)度最低的是第一季度。這與直觀對數(shù)據(jù)分析的結(jié)果一致,表明每年從第一季度開始深圳港集裝箱吞吐量逐漸遞增,在第三季度達到峰值,第四季度稍稍回落到與第二季度接近的水平,而來年第一季度吞吐量又迅速降低。根據(jù)量化結(jié)果,深圳港在未來的規(guī)劃發(fā)展中應(yīng)依據(jù)此規(guī)律,制定有效計劃,合理規(guī)劃交通、資源配置等問題。
指數(shù)平滑法是特殊的移動平均法,其特點在于對過去的觀測值分配不一樣的權(quán)重,新數(shù)據(jù)給予較大的權(quán)重,舊數(shù)據(jù)給予較小的權(quán)重,預(yù)測值是以前觀測值的加權(quán)和。指數(shù)平滑預(yù)測法包括3種,其中:一次指數(shù)平滑法適合無趨勢的平穩(wěn)時間序列;二次指數(shù)平滑法適合呈線性趨勢的時間序列;三次指數(shù)平滑預(yù)測法適用于不規(guī)則、呈非線性趨勢的時間序列。港口集裝箱吞吐量受國家政策、周邊經(jīng)濟發(fā)展?fàn)顩r和自然環(huán)境等因素影響,導(dǎo)致其具有明顯的非線性特征。因此,使用三次指數(shù)平滑法來對其進行初值預(yù)測。三次指數(shù)平滑公式[13]為
(15)
第t+m期的預(yù)測值為
(16)
式(16)中:m為預(yù)測步長,取正整數(shù)1,2,3,…。其中預(yù)測參數(shù)為
(17)

一般情況下確定平滑初值有兩種方式:
1) 當(dāng)數(shù)據(jù)量較多時,應(yīng)取
(18)
2) 當(dāng)數(shù)據(jù)量較少時,一般選取最初三期的平均數(shù)作為初值,即
(19)
另外,選取合適的平滑系數(shù)對于建立平滑模型非常關(guān)鍵。若數(shù)據(jù)波動較大,為提高預(yù)測精度,應(yīng)將α值取大一些,以增加近期數(shù)據(jù)的權(quán)重;若數(shù)據(jù)波動平穩(wěn),則α值應(yīng)取小一些。
當(dāng)數(shù)據(jù)量較多時,可編制通用化程序,計算動態(tài)平滑系數(shù);當(dāng)數(shù)據(jù)量較少時,一般采用試算法確定α值,即先根據(jù)自身數(shù)據(jù)變化趨勢來大致確定取值范圍,再根據(jù)取值范圍選取不同的α值進行試算,將預(yù)測誤差平方和最小的α選為最終參數(shù)。誤差平方和最小公式為
(20)
ES-Markov模型結(jié)合三次指數(shù)平滑法與馬爾科夫模型,首先利用三次指數(shù)平滑法得出初始預(yù)測值,再用馬爾科夫原理得到狀態(tài)轉(zhuǎn)移矩陣,修正初始預(yù)測值,以此提高預(yù)測精度。以下為具體步驟。
2.2.1計算精確度[14]
精確度為實際值與三次指數(shù)平滑預(yù)測初值之比,即
(21)
2.2.2狀態(tài)區(qū)間劃分
通過簡單層次聚類將精確度劃分為n個狀態(tài),其狀態(tài)區(qū)間表示為Ei=[Ei1,Ei2],其中:Ei1、Ei2分別為狀態(tài)Ei的上下限,總的精確度集合為E= (E1,E2,…,En)。
2.2.3構(gòu)建狀態(tài)轉(zhuǎn)移概率矩陣
狀態(tài)轉(zhuǎn)移概率Pij(k)計算為
(22)
式(22)中:Pij(k)為客觀事物經(jīng)一種狀態(tài)轉(zhuǎn)移至另一種狀態(tài)發(fā)生的概率,其中Mi為Ei狀態(tài)的原始數(shù)據(jù)數(shù)量;Mij(k)為Ei經(jīng)過k步轉(zhuǎn)移至狀態(tài)Ej的原始數(shù)據(jù)數(shù)量,處于樣本序列末尾的Mi不計入算式。
狀態(tài)轉(zhuǎn)移矩陣由狀態(tài)轉(zhuǎn)移概率組成,其代表著客觀事物在t時刻所處狀態(tài)轉(zhuǎn)變?yōu)?t+1)時刻所處狀態(tài)時的條件概率矩陣,其表達式為
(23)
2.2.4確定預(yù)測時刻轉(zhuǎn)移狀態(tài)
馬爾科夫鏈具有無后效性,即轉(zhuǎn)移的發(fā)生只與當(dāng)前狀態(tài)有關(guān),假設(shè)預(yù)測對象處于Ei狀態(tài),則僅考察當(dāng)前狀態(tài)轉(zhuǎn)移概率矩陣第i行狀態(tài)向量P(t),若第j列概率值最大,則預(yù)測對象下一時刻最有可能轉(zhuǎn)向Ej狀態(tài)。
2.2.5修正預(yù)測初值
超聲波模塊固定在小車的正前方,用來檢測正前方的障礙物。在這里筆者選用的型號是US-100,其測距范圍為2cm-450cm,自帶溫度傳感器可以自動對測試結(jié)果進行校正,具有電平輸出和UART輸出兩種輸出方式,小車使用的是電平輸出。該模塊具有五個端子,1號端子接VCC電源;4號和5號端子接外部電路的地;2號端子為 Trig端;3號端子為 Echo端。需要測距時,單片機會從Trig管腳輸入一個10微秒以上的高電平,系統(tǒng)會發(fā)出8個40KHz的超聲波脈沖,然后檢測回波信號,經(jīng)過溫度校正后,將結(jié)果通過Echo管腳輸出[3]。
首先確定預(yù)測對象下一步轉(zhuǎn)移到狀態(tài)Ei,然后結(jié)合三次指數(shù)平滑法所得初值和所處狀態(tài)確定組合預(yù)測優(yōu)化值yt。
(24)
設(shè)置以下3個檢驗精度的指標(biāo):
1) 將t時刻實際值與預(yù)測值的相對誤差記為δ(t),其表達式為
(25)
2) 將所有時刻的平均絕對百分誤差記為(Mean Absolute Percentage Error, MAPE),其表達式為
(26)
3) 將所有時刻的均方根誤差記(Root Mean Square Error, RMSE),其表達式為
(27)
以2012—2016年深圳港集裝箱季度吞吐量作為原始數(shù)據(jù),如表1所示。首先使用三次指數(shù)平滑法、組合預(yù)測優(yōu)化模型分別對數(shù)據(jù)進行擬合,再預(yù)測2017年4個季度的集裝箱吞吐量,并將預(yù)測值與實際值進行對比。
首先確定平滑初值,由于本文數(shù)據(jù)量只有20個,而初始值對預(yù)測值影響較大,因此,采用前3個數(shù)據(jù)的平均數(shù)作為初始值,即

(28)
本文利用MATLAB,首先選取幾個大致區(qū)間臨界值代入進行試算,找出誤差平方和最小的區(qū)間,再從該區(qū)間內(nèi)找到使誤差平方和最小的α值,經(jīng)過計算,確定α=0.1時預(yù)測誤差最小。
通過三次指數(shù)平滑模型得出預(yù)測結(jié)果,由于篇幅所限,各季度對應(yīng)的平滑值與參數(shù)無法全部展示。主要預(yù)測2016年之后的集裝箱吞吐量,因此,取t=20,根據(jù)式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7,根據(jù)式(16)得到三次平滑預(yù)測式為
(29)
由式(29)得出2017年4個季度的3次平滑預(yù)測初值分別為601.99萬TEU、605.93萬TEU、609.95萬TEU、614.06萬TEU。
3.2.1劃分狀態(tài)區(qū)間
根據(jù)三次指數(shù)平滑法的初步預(yù)測結(jié)果,可得到預(yù)測初值的精確度序列,通過簡單層次聚類,將精確度序列劃分為(0.854 2,0.939)、(0.939,1.032 8)、(1.032 8,1.126 6)、(1.126 6,1.220 4)等4個狀態(tài),各季度集裝箱吞吐量所處狀態(tài)見表2。

表2 各預(yù)測模型擬合精度對比與狀態(tài)劃分
3.2.2預(yù)測狀態(tài)向量及預(yù)測值計算
通過式(24)得到由Markov優(yōu)化后的2012—2016年吞吐量組合預(yù)測值如表2所示。根據(jù)馬爾科夫預(yù)測原理,得到1步轉(zhuǎn)移矩陣P1為
(30)
由于2016年第四季度處于狀態(tài)E3,由P1可知2017年第一季度預(yù)測狀態(tài)向量P(1)=(1/5,2/5,1/5,1/5),則2017年第一季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測值為593.50萬TEU;此時再求出二步轉(zhuǎn)移矩陣P2=(P1)2,得到2017年第二季度預(yù)測狀態(tài)向量P(2)=(21/160,169/320,9/40,37/320),則2017年第二季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測值為597.39萬TEU;同理,2017年第三季度預(yù)測狀態(tài)向P(3)=(390/2 203,950/2 753,587/1 600,646/5 819),則2017年第三季度集裝箱吞吐量最有可能處于狀態(tài)E3,求出組合預(yù)測值為658.57萬TEU;同理,2017年第四季度預(yù)測狀態(tài)向量P(4)=(860/4 879,167/464,583/1 678,287/2 466),則該港口2017年第四季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預(yù)測值為605.40萬TEU。
由表2可知:相比傳統(tǒng)的三次指數(shù)平滑模型、灰色預(yù)測模型,組合優(yōu)化模型使相對誤差都降至5%以下,再計算出各模型的平均相對百分誤差及均方根誤差,見表3。

表3 各模型精度檢驗結(jié)果
由表3可知:組合模型所得平均相對百分誤差(MAPE)相比灰色模型降低4.21%,比三次指數(shù)平滑模型降低4.97%;組合模型所得均方根誤差(RMSE)相比灰色模型降低29.56,比三次指數(shù)平滑模型降低36.55,預(yù)測精度大幅提高。2012—2017年的實際值與3種模型的預(yù)測值對比見圖1,可看出相對于傳統(tǒng)的三次指數(shù)平滑模型和灰色預(yù)測模型,組合模型的預(yù)測曲線與實際值曲線更加吻合,模型效果更優(yōu)。

圖1 3種模型預(yù)測結(jié)果對比圖
本文使用加權(quán)灰色關(guān)聯(lián)分析和ES-Markov組合模型,對深圳港2012—2017年集裝箱季度吞吐量數(shù)據(jù)進行定量研究,結(jié)果表明:港口集裝箱吞吐量存在季節(jié)性波動,組合預(yù)測模型能很好地適應(yīng)其發(fā)展變化規(guī)律,且預(yù)測精度和擬合度較高,同時建模相對簡單、易于實現(xiàn),可為港口未來的決策規(guī)劃提供新思路。