劉成勇, 萬偉強, 陳蜀喆, 甘浪雄
(1.武漢理工大學 航運學院, 武漢 430063;2.湖北省內河航運技術重點實驗室, 武漢 430063)
目前,國內外學者關于船舶交通流量預測的理論方法很多且逐漸趨于完善,孔垂猛等[1]利用灰色馬爾科夫模型對現有道路斷面或交叉口進行短時交通流量預測,能滿足短時交通流量預測的精度要求。尹素素等[2]針對短時交通流量預測在精度和收斂速度方面的不足,將二進制序列索引和灰色馬爾科夫波動性預測模型相結合,具有較好的實際應用效果。林巖等[3]將灰色模型與馬爾科夫鏈結合,建立了針對道路交通事故預測的灰色馬爾科夫模型并對我國道路交通事故歷史數據進行預測,驗證模型的可靠性。董慧君等[4]運用灰色GM(1,1)馬爾科夫模型,以江蘇統計年鑒公布的江蘇省2006—2012年貨物周轉量的統計數據為依據,對其2013—2015年的物流規模進行預測,效果較好?;疑R爾科夫模型在預測上應用廣泛,而在交通流預測方面,研究者大多直接利用灰色馬爾科夫模型,或對灰色馬爾科夫模型進行改進,或將灰色馬爾科夫模型與其他理論模型相結合,來預測道路交通流及道路交通事故數量等,而利用灰色馬爾科夫模型對船舶交通流量進行預測的研究仍處于探索階段。
灰色系統理論是指按照某種要求進行數據處理或變換,得到弱化隨機性而強化規律性的新數列,挖掘出原始序列的內在特征。幾何圖形描繪的變化一般為指數型平滑曲線。由于指數型變化是單調上升或下降的,因此,作長期預測時其預測值就會偏高或偏低。對隨機性和波動性較大的數據擬合較差,預測精度降低。馬爾科夫模型是用來預測具有等時間隔(見1 a))的時刻點上各類數據的分布狀況,描繪一個隨機變化的動態系統,根據狀態之間的轉移概率來推測一個系統未來的發展變化,轉移概率反映各隨機因素的影響程度及各數據之間轉移的內在規律性,適合于描述隨機波動性較大的預測問題,可彌補灰色預測的不足。
馬爾科夫模型還要求預測的對象具有平穩過程等均值特點,而實際中遇到的預測問題是隨時間變化呈現某種變化趨勢的非平穩隨機過程,時序數據總是圍繞變化趨勢出現波動而產生偏差。若利用灰色預測對這些時序數據進行擬合,找出并預測數列的發展變化總趨勢,可彌補馬爾科夫預測的不足。因此,將兩種預測模型結合為灰色馬爾科夫預測模型,就能充分利用歷史數據,為隨機波動性較大的數據預測工作提供新的方法,可提高預測的精度。
目前,利用灰色馬爾科夫模型對船舶交通流量進行預測的研究仍處于探索階段。船舶交通流量增加后,水上交通事故發生率也隨之增加,因此,對船舶交通流量進行預測,能為航道的規劃、設計和船舶通航管理提供基礎性數據,對保證水上交通安全具有重要作用。國內外預測船舶交通流量的方法較多,但由于船舶交通流量隨時間的周期性變化具有一定的連續性,由于受各種因素的擾動也具備一定的非平穩隨機過程,它具有一定的波動性和隨機性,符合灰色馬爾科夫模型預測的特征。該研究的創新性是利用灰色馬爾科夫模型對船舶交通流量進行預測,為水上交通領域船舶交通流量提供一種新的預測方法,具有堅實的理論基礎和應用空間。
灰色GM(1,1)馬爾科夫鏈模型是充分發揮兩者的優勢組合而成的模型,該模型在公路交通事故、客流量預測和農作物產量的短期預測等方面已得到廣泛應用[6-9],本文采用灰色馬爾科夫模型用于水上交通領域船舶交通流量的預測,在船舶交通流量預測方面屬于探索性研究。
對原始數據X(0)={x(0)(1),x(0)(2),…,x(0)(n)}累加生成,弱化數據的隨機性和波動性,增加信息白化度,呈現出一定的規律性,得:X(1)={x(1)(1),x(1)(2),…,x(1)(n)},構造數據矩陣B及數據向量Y為
Y=((x(0)(1),x(0)(2),…,x(0)(n))T
(1)
(2)

(3)
(4)
灰色模型數據曲線是指數型變化曲線,可反映出原始數據列呈指數規律變化的總趨勢。因此,灰色預測模型對呈指數規律變化趨勢的系統進行預測是合適的。隨著時間的推移,擾動因素影響加大,對隨機性和波動性較大的數據擬合較差。
馬爾可夫模型的特性是狀態空間和時間參數都是離散的隨機過程。
1.2.1狀態劃分
目前,馬爾科夫鏈模型的狀態根據實際情況進行劃分,一般依據選取的樣本數量的多少和誤差范圍等因素來確定。
1.2.2狀態轉移概率矩陣
馬爾可夫鏈的轉移概率矩陣P由狀態空間及參數集合確定,關于這一概率的確定,可由問題的內在規律得到,也可通過經驗得出,還可根據觀測數據來估計,然后根據轉移概率組成其概率矩陣為
(5)
馬爾可夫鏈描繪一個隨機變化的動態系統,轉移概率反映了各隨機因素的影響程度,適合于描述隨機波動性較大的預測問題。
1.2.3模型精度的檢驗
為了保障計算結果的精確性和可用性,有必要對所建立的模型GM(1,1)中的殘差進行查驗,計算X(0)與殘差的標準差S1、S2和關聯系數η(k),并根據其分別計算出均方差比值C和小誤差概率P,即:
(6)
(7)
C=S2/S1
(8)
(9)
(10)
選取長江口河段2011—2014年各月平均船舶交通流量數據作為預測的原始時間序列,以2015年1—6月的月平均交通流量作為預測對比序列。為了體現實際船舶尺度對船舶交通流量的影響,統計數據標準船長為90 m,其余船長按加權進行規范化處理。加權標準船舶流量計算方法見表1。

表1 加權標準船舶流量計算方法
加權后所有船舶交通流量可在90 m標準船長上進行計算分析,船舶加權流量見表2。
記X(0)=(x(0)(1),x(0)(2),…,x(0)(48)),其中x(0)(k)為第k月的船舶交通流量,k=1,2,…,48基于上述灰色預測法,利用MATLAB推導計算,求得a=0.005 02,μ=1 843.376 81。所以船舶交通流量的一次累加序列的GM(1,1)模型為
利用式(6)~式(10)對模型GM(1,1)的精度進行計算和檢驗(見表3和表4),可得出以下結論。
1)相對殘差Φ(i)均值為13.18%,殘差序列中最大值高達52.74%。

關聯系數為η(k),k=1,2,…,n,如式(10)所示。

表2 2011—2015年長江口河段船舶加權交通流量 艘次

表3 檢驗標準

表4 灰色GM(1,1)船舶交通流量1—6月相對誤差表
3)X(0)的標準差為
(11)
絕對殘差Δ(0)的標準差為
(12)
(13)
根據以上計算分析,小概率誤差P=0.81,并將其與表2的檢驗標準進行對比分析可知:GM(1,1)模型有較好的后驗精度;利用單一的GM(1,1)模型對船舶交通流量預測,預測結果的相對誤差值較大,不能反應船舶交通流量的實際情況,因此需對其進行修正。
2.2.1狀態劃分
利用馬爾可夫鏈校正船舶交通流量是運用P對未來船舶交通流量的變化趨勢做出合理恰當的估計,P根據X(0)求得。
為了獲得P,需要確定船舶交通流量的狀態。根據文獻[10]馬爾可夫鏈的狀態劃分方法,可將長江口河段的船舶交通流分為7種狀態(見表5)。

表5 船舶交通流量狀態劃分
2.2.2概率轉移矩陣的建立
由于X(0)最后一個數據的不確定性,故除去2014年12月數據資料,根據落入各狀態的樣本數和狀態轉移概率矩陣的確定方法,得到一步轉移矩陣為
(15)
由于2014年12月流量處于第7種狀態,所以考慮矩陣的第7行中的最大值。確定2015年1月流量處于第5種狀態,計算預測區間為(1 727,1 891)艘,平均值為1 809艘。
(16)
由以上轉移矩陣確定2015年2月船舶交通流量狀態為第5種狀態,計算預測區間為(1 563,1 727)艘,平均值為1 645艘。同理,2015年3—6月交通流量的最終預測值分別為1 317艘、1 809艘、1 481艘、1 276艘。
2.2.3計算預測值
將GM(1,1)單一模型計算結果、灰色馬爾科夫鏈模型計算結果與實際值進行比對分析(見圖1和表6)。
由表6可知,灰色GM(1,1)馬爾可夫鏈模型的預測結果較灰色GM(1,1)預測結果更逼真地接近實際值,且相對誤差值較小,如4月份的相對誤差從18.7%(灰色預測值)降至3.1%(灰色馬爾科夫預測值);圖1明確地反應出灰色GM(1,1)預測模型和灰色GM(1,1)—馬爾科夫鏈預測模型的結果截然不同,前者呈一條直線,偏離實際值,擬合精度較差,后者隨著實際船舶交通流量的波動而波動,具有較高的擬合精度,擬合精度高達97.71%。

表6 兩種模型的相對誤差值表
(1) 從模型理論分析,灰色GM(1,1)模型將系統生成序列長期及持續變化過程用微分方程形式表達出來,利用指數曲線去擬合原始數據,對于波動性較大的數據序列,該方法的準確度將大大降低;
(2) 馬爾可夫過程是一種無后效性的隨機過程,它根據狀態之間的轉移概率預測系統未來的發展。
將這兩種模型結合,建立灰色GM(1,1)馬爾可夫鏈模型,不僅考慮了GM的預測趨勢,還考慮了數據的波動情況,結合兩者優點,可在很大程度上提高預測的準確度。因此,從實例驗證和模型理論兩個方面分析,灰色GM(1,1)-馬爾可夫鏈模型對于具有一定波動性和隨機性的船舶交通流具有較高的預測精度。
本文采用灰色馬爾科夫模型對船舶交通流量進行預測并檢驗,其預測結果與實際值差異性不大,能夠較好地反映船舶交通流量的總體變化趨勢,較單一的灰色預測結果精度具有較大的提升,可為船舶交通流量預測研究提供科學的理論依據與技術支持。以長江口河段船舶交通流量為例進行的預測分析研究結果表明:灰色馬爾可夫鏈模型的預測結果較單純的運用灰色預測更接近于實際船舶交通流量,且相對誤差值較小并具有較高的擬合精度,此模型在預測船舶交通流量時具有較高的可靠性。