王新杰 陳淮莉






【關鍵詞】 港口貨物吞吐量預測;經濟指標;GA-BP模型;主成分分析;上海港
0 引 言
隨著“一帶一路”建設的不斷推進,我國進出口貿易總額逐年穩步上升,港口物流業迅速發展。有效預測港口貨物吞吐量,能夠優化資源配置、協調集疏運系統,為港口貨運作業規劃提供科學依據。常用的港口貨物吞吐量預測方法有人工神經網絡模型、時間序列模型、灰色預測模型和回歸模型。人工神經網絡模型有Elman神經網絡、灰色神經網絡和BP神經網絡等算法,這些算法對非線性關系預測效果較好,但對網絡的初始閾值和權值有較強依賴,容易陷入局部最優解;時間序列模型有移動平均法、指數平滑法以及自回歸差分移動平均(ARIMA)模型等,這些算法能夠較好地體現數據季節性變化,但對于突變波動的預測效果較差;灰色預測模型僅需少量數據即可進行預測,多應用于短期貨物吞吐量年度數據的預測;回歸模型可以突出數據變化的影響因素,通常會結合新興技術廣泛應用于港口貨物吞吐量預測領域,但該方法需要大量的技術經濟指標作為模型建立的依據,且數據統計難度較大。
影響港口貨物吞吐量的因素眾多且存在非線性關系。BP神經網絡模型進行預測效果較好,但該模型容易陷入局部最優,且各月份因素指標獲取難度較大;遺傳算法(Genetic Algorithm,GA)具有良好的全局搜索能力,而經濟指標[1]對貨物吞吐量影響最大。因此,基于遺傳算法優化神經網絡模型(GA-BP模型),結合經濟指標提出能夠較好體現非線性變化、突出因果關系、數據收集難度適中的貨物吞吐量短期預測模型。選取2012―2020年上海港貨物吞吐量月度數據,運用GA-BP模型進行預測分析,并根據上海市經濟指標設定經濟影響函數,對準預測結果進行修正。試驗證明,結合經濟指標影響的GA-BP模型的預測效果比傳統時間序列模型和BP神經網絡模型更優。
1 考慮經濟指標影響的GA-BP模型
1.1 問題描述
以全月貨物吞吐量數據為一個預測周期,根據m周期的歷史數據即{yt m+1,yt m+2,…,yt},預測得到未來一個周期貨物吞吐量的準預測值 ,其中yt表示第t月的貨物吞吐量實際值。由于根據歷史數據趨勢外推得到的準預測值不能體現因果關系且具有不確定性,加之港口貨物吞吐量必然受到港口腹地經濟、港口規模、政策、天氣等因素的影響,其中經濟因素影響最顯著,因而根據港口腹地經濟指標對準預測值進行修正得到最終預測值 。具體流程見圖1。
1.2.1 GA-BP模型
2 GA-BP模型算法
本文采用GA對BP的初始閾值和權值進行優化,確定最優初始閾值和權值后再運用BP進行預測,流程見圖2。
為提高驗證準確性,將上海港2012―2020年各月份貨物吞吐量數據劃分為3組進行訓練和驗證預測,數據集劃分結果見圖3。
通過SPSS軟件對各個特征指標進行主成分分析,得到5個主成分并通過加權平均的方法計算綜合得分。對結果進行非負處理并轉化為[1,101],最終得到各月份的經濟指數。為體現經濟指數對貨物吞吐量的影響,運用MATLAB軟件對2012―2020年的貨物吞吐量與經濟影響指數進行灰色關聯度分析,得到二者的灰色關聯度為0.74;根據經濟影響指數得到各月度經濟影響函數,并對GA-BP模型輸出的準預測值進行修正(其中r=0.74,n=0.1),得到最終預測值(見表2)。
由表3可知,考慮經濟指標影響的GA-BP模型預測結果的平均絕對誤差為217.3、均方根誤差為273.7、平均絕對誤差百分比為5.2%。這說明預測效果優于ARIMA模型和BP神經網絡模型。
4 結 語
利用GA較強的全局尋優能力,對BP的初始閾值和權值進行優化,同時考慮經濟指標的影響,對港口貨物吞吐量進行短期預測。結果表明:考慮經濟指標影響的GA-BP模型預測效果最優,可以為同類型港口的貨物吞吐量預測提供參考。然而,由于月度經濟數據的缺失率較高、獲取難度較大,因此部分指標采用指數指標作為替代,以致該模型存在一定的局限性。此外,運用該模型對其他港口貨物吞吐量進行預測時,經濟影響函數的參數需要根據數據進行修正。未來可在經濟指標的選取以及模型參數的動態確定上作進一步研究。
參考文獻:
[1] 黃建康,姚遠. 港口吞吐量預測影響因素辨識研究[J]. 商場現代化,2014(22):76-78.
[2] 梁明奇,王敏,朱江龍. 基于主成分分析法的五排水庫水質評價[J]. 湖北大學學報(自然科學版),2021(2):163-169.
[3] 楊洋,陳家俊. 基于群智能算法優化BP神經網絡的應用研究綜述[J]. 電腦知識與技術,2020(35):7-10,14.