楊思凡



摘要:港口貨物吞吐量預測對我國對外進出口貿易、沿海進出設施建設以及相關政策的發布具有重要參考意義,然而港口貨物吞吐量數據表現出不平穩和非線性特性,給預測帶來了一定的難度。因此,文章提出基于多因素選擇和誤差修正的BP神經網絡港口貨物吞吐量預測。首先,根據已有文獻研究得出港口貨物吞吐量的有關影響因素,包括GDP、進出口總額、社會消費品零售總額、泊位個數、碼頭長度、貨運量數據等。其次,運用多元線性回歸分析對相關影響因素進行處理,選擇相關程度高和影響程度大的因素作為港口貨物吞吐量的輸入。然后,用BP神經網絡對其進行預測,得出該階段的預測值,該結果與實際值相近,但仍存在一定差距。由此本文對其預測結果進行誤差修正,獲得最終預測值。最后,為驗證模型的有效性,對本模型進行實證分析,實驗結果表明,結合多因素和誤差修正的混合預測方法能更準確的擬合歷史數據,得到更優化的預測結果。
關鍵詞:多因素模型;誤差修正;BP神經網絡;港口貨物吞吐量預測
Abstract: Port cargo throughput prediction has important reference significance for China's foreign import and export trade, coastal facilities construction and the release of relevant policies, but the cargo throughput data of the port shows unsteady and nonlinear characteristics which brings certain difficulties to the prediction. Therefore, this paper proposes a BP neural network cargo throughput prediction based on multi-factor and error correction. Firstly, according to the existing literature, relevant influencing factors of port cargo throughput are obtained, which mainly include GDP, total volume of imports and exports, total retail sales of social consumer goods, number of berths, length of terminals, data of freight volume, etc. Secondly, multiple linear regression analysis was used to deal with the relevant factors, and the factors with high degree of correlation and large degree of influence are selected as the input of port cargo throughput. Then, BP neural network is used to predict it, and the predicted value of this stage is obtained. The result is close to the expected output, but there is still a gap. The error correction of the prediction results is carried out to obtain the final prediction value. Finally, in order to verify the validity of the model, the empirical analysis of the model is carried out. The experimental results show that the hybrid forecasting method combined with multi factor and error correction can more accurately fit the historical data and get more optimized forecasting results.
Key words: multi-factor model;error correction;BP neural network;port throughput forecast
0? 引言
港口貨物吞吐量體現著港口經營的成果,是我國港口建設、運輸能力、經濟發展實力的體現。隨著我國經濟實力的不斷增長,國際貿易規模不斷增大,貿易活動與港口建設的相互推進,促進著經濟再生長。而對我國港口貨物吞吐量的預測有利于國家對港口的發展進行更有效的規劃建設、結構調整等,以此確保國際商貿快速穩固發展、保障國家參與國際經濟合作和競爭實力。因此,有必要提高港口吞吐量的預測精確度。
目前,已有許多研究者對港口貨物吞吐量預測的方法進行研究,主要分成統計計量方法和人工智能方法。其中統計計量方法包括指數平滑、ARIAM和灰色模型。貢文偉等[1]提出了指數平滑法結合灰色預測模型。Min Liu等[2]探討了指數平滑法的波動率預測。薛俊強[3]利用ARIMA模型對寧波港的集裝箱吞吐量進行預測。趙一棋等[4]基于時間序列模型,構建ARIMA模型對其月度數據進行預處理后預測。劉明英等[5]采用灰色預測方法針對特定港口季度吞吐量進行預測,用灰色模型抵消數據統計不完善的缺點,但效果有待提高。田雪等[6]采用灰色模型對曹妃甸港口的貨物吞吐量進行研究。上述研究在線性假設條件下表現出良好的預測效果,但是港口貨物吞吐量具有非線性、非平穩性等特征的情況下,統計計量模型對復雜性、波動性數據的預測結果不夠完善,精確度也有待提高。
人工智能方法具有較強的非線性映射能力,被廣泛的應用于港口貨物吞吐量預測當中,主要包括BP、RBF、Elman神經網絡模型。陳錦文、孫巧萍等[7,8]通過對 BP神經網絡的改進對港口吞吐量進行預測。席申娥等[9]提出雙時間序列與RBF的組合預測方法,首先利用ARIMA模型和灰色預測模型分別對歷史數據進行預測,選取灰色時間序列作為RBF的輸入量進行預測。楊珩等[10]利用Elman神經網絡模型對港口吞吐量進行預測。以上研究者針對港口貨物吞吐量的研究只是單純對港口貨物吞吐量歷史數據進行預測,忽略了相關因素對港口貨物吞吐量的影響。因此,本文考慮相關影響因素對港口貨物吞吐量預測的重要性,提出將重要影響要素與歷史數據相結合進行預測。
以往對港口貨物吞吐量的預測研究忽視了預測誤差的意義,沒有從誤差中提取有效的信息并加以利用,造成預測結果不理想的情況。Hongyuan Luo等[11]提出基于誤差修正模型的精度明顯高于修正前的預測模型。目前基于誤差修正的研究越來越多,并且在預測方面取得了較好的研究成果,但在貨物吞吐量上還沒有應用。BP神經網絡可以對多維數據進行較好的預測,但是預測結果的精確度還有待提高。王洪樂等[12]利用BP神經網絡對數控機床進行了綜合誤差彌補。因此,本文提出利用BP神經網絡模型對初始預測的結果進行誤差修正,優化預測結果。
綜上可知,現有研究存在兩個問題:一是現有研究僅利用港口貨物吞吐量單項數據研究,沒有考慮相關因素對港口貨物吞吐量的預測結果的影響。二是現有研究模型所得出的預測結果的精確度還有待提高,并且沒有對結果進行誤差修正,因此采用誤差修正可以進一步提高預測的精確程度。
針對上述問題,本文提出基于多因素選擇和誤差修正的BP神經網絡預測模型對我國港口貨物吞吐量進行預測。首先,利用SPSS軟件對可能的影響因素進行多元線性模型分析,并選取影響程度較大并且線性不相關的三個因素作為港口貨物吞吐量的影響因素。其次,用BP神經網絡對其組成的多維時間序列進行預測,得到預測結果。然后,經過初步對比分析,多維時間序列預測結果較好,但其預測精度仍有提升較大空間,所以對初次BP預測結果進行誤差修正,并輸出最終預測值。最后,為驗證模型的有效性和適用性,運用相對誤差對預測結果進行分析。結果表明,此模型的擬合程度較高,能夠更精確的預測出港口貨物吞吐量。該方法考慮了主要影響因素的影響,并對預測結果進行了誤差修正,提高了預測的合理性,并且在預測精度上也達到了滿意效果,為后續的研究提供了新思路。
1? 基本模型
1.1 多元線性回歸
多元線性回歸模型通常是由一個因變量和與其線性相關的多個自變量組成的模型。設因變量y和自變量x1,x2,…xn均有n組數據,若y與x1,x2,…xn線性相關,則
1.2 因素選擇
因素篩選方法主要有多元線性回歸分析、主成分分析和灰色關聯分析法。劉枚蓮[13]在研究港口貨物吞吐量影響因素的篩選方法時提出主成分分析法無法考慮各指標之間的關聯度。而灰色關聯分析法缺乏客觀性和確定性。因此本文選擇多元線性回歸分析作為篩選關鍵指標的方法。
主要步驟如下:
Step1:將港口貨物吞吐量設為因變量,GDP、社會消費品零售總額、碼頭長度、泊位個數和進出口總額設為自變量建立多元線性回歸模型。
Step2:對模型進行共線性檢驗,發現模型存在多重共線性。對模型進行調整,采用逐步回歸法。分別對5個自變量和因變量做一元線性回歸分析,根據擬合優度選出第一個關鍵指標。
Step3:將剩余變量分別與選出的自變量和因變量做二元線性回歸分析,綜合擬合優度和F值,選出第二個關鍵指標。以此類推選出第三個關鍵指標。
Step4:剩余2個變量分別與選出的3個自變量和因變量做四元線性回歸分析,由于P值均過大,因此剔除這2個變量,選定三個關鍵指標。
1.3 BP神經網絡
BP神經網絡是一種按照誤差反向傳播算法訓練的多層前饋網絡,在傳統神經網絡的輸入層和輸出層之間加入隱含層來處理非線性問題。BP神經網絡經過將信號正向傳播后,逆向進行誤差反饋,通過自行調整輸入層與隱含層以及隱含層與輸出之間的閾值和連接強度,反復學習,訓練出與與期望輸出擬合最好所相對應的權值和閾值。模型結構圖如圖1所示。
2? 基于多因素選擇和誤差修正的BP神經網絡預測模型
本文提出的基于多因素選擇和誤差修正的BP神經網絡港口貨物吞吐量預測模型基本步驟如下:
Step1:多因素選擇。對港口貨物吞吐量及其影響因素做多元線性回歸分析,由于自變量之間存在多重共線性,對模型進行調整,采用逐步回歸法,綜合擬合優度和顯著性效果,選出三個因素,分別為碼頭長度、GDP和進出口總額。
Step2:BP神經網絡預測。將上述三個影響因素與歷史數據共同作為輸入量,并用BP神經網絡進行預測。
Step3:誤差修正。前一階段的預測精度仍有待提高,因此進行誤差修正,將BP神經網絡預測出的數據與歷史數據相減得到的誤差序列,此時再用BP神經網絡對誤差序列進行預測,并將預測結果與BP預測結果相加得到港口貨物吞吐量最終預測值。
Step4:對比分析。為驗證模型的有效性,利用MAPE值、相對誤差和誤差均值作為評價指標進行分析。并與其他模型進行對比,結果表明,本文提出的基于多因素和誤差修正的BP神經網絡港口貨物吞吐量預測模型具有更優預測效果的結論。
3? 實例分析
3.1 數據來源與評價指標選擇
3.1.1 數據來源
本文選擇2000-2018年全國港口貨物吞吐量及其影響因素的年度數據進行分析,數據來源于國家統計局(http://www.stats.gov.cn/),如圖3所示。樣本數據為進出口總額、GDP及碼頭長度的年度數據,將樣本數據分為兩個部分,2000-2014年的作為訓練集,2015-2018年的作為測試集。