程元棟,喻可欣,李先洋
安徽理工大學經濟與管理學院,安徽 淮南 232001
精準的物流需求預測能為政府、交通運輸行業在物流規劃、物流基礎設施投資與建設、產業規劃與布局等方面提供有力的決策依據,同時可幫助相關企業及經營者調節日常物流生產活動,指導作出最優決策。物流需求作為派生性需求,不僅與區域經濟發展相關,還受多方面因素制約,難以從單一維度進行分析[1]。
目前物流需求預測研究多基于物流量的歷史數據,采用單一或組合模型進行預測[2]。劉炯[3]、王迪[4]基于多項歷史數據,采用多元線性回歸模型對物流需求及其影響因素進行實證分析;吳玉國等[5]采用灰色-馬爾科夫組合模型建立貨運周轉量預測體系;武亞鵬等[6]運用有效度法對線性回歸模型、自回歸移動平均(autoregressive integrated moving average,ARIMA)模型進行線性組合,預測武漢市的物流需求;張婉琳[7]將灰色關聯預測與ARIMA模型預測組合,預測寧波港口物流需求。
ARIMA模型是計量經濟學中的一類模型,能有效擬合預測對象的時間序列,但采用單一ARIMA模型預測時,可能會在部分時刻因外部因素沖擊,導致預測數據與實際數據存在較大偏差,具體表現為殘差的異方差性[8]。本文采用加權馬爾科夫模型修正殘差序列,構建加權馬爾科夫-ARIMA修正模型,以國家統計局公布的我國1991年1月至2021年12月的貨運周轉量為物流需求數據進行實例分析,驗證加權馬爾科夫-ARIMA修正模型對區域物流需求預測的準確性,以期為物流規劃決策活動提供前提依據。
將自回歸(auto regressive,AR)模型、移動平均(moving average,MA)模型和差分法結合構成ARIMA模型,采用ARIMA模型可將一組單變量的時間序列,采用差分等方式把不可預測的非平穩序列轉化為平穩序列,通過構建數學模型進行統計描述[9]。假設自回歸階數為p,原始數據差分后達到平穩的次數為d,移動平均階數為q,則ARIMA(p,d,q)模型為:
式中:▽dyt為序列yt的d階差分,αi為第i項的自回歸系數,βj為第j項的移動平均系數,εt為yt的殘差。
加權馬爾科夫模型以殘差序列的各階自相關系數體現不同滯期各狀態間相互影響的強弱,能有效利用歷史數據[10]。實際貨運周轉量序列減去ARIMA模型預測的貨運周轉量序列,得到隨機殘差序列,將殘差序列劃分成多種狀態,計算一步轉移頻數矩陣與一步轉移概率矩陣,進行馬氏性檢驗[11]。通過馬氏性檢驗后,采用殘差序列的各階自相關系數確定各階權重,加權求和后預測將來期數的狀態。最后依據模糊集理論中的狀態特征值,將預測狀態轉變為預測結果,實現修正殘差序列的目的[12]。
構造χ2統計量,對殘差序列進行馬氏性檢驗,公式為:
(1)
式中:fij為狀態i一步轉移至狀態j的頻數,pij為轉移概率,p·j為邊際概率,m為矩陣的行(列)數。
根據分級情況,計算對應階數的自相關系數,k階的自相關系數
(2)

將rk歸一化,得到k階權重
(3)
狀態i的加權和
(4)
式中pi為k階滯期時狀態i的轉移概率。
依據最大概率隸屬度原則,max{Pi}對應狀態為該期殘差的預測狀態。
采用模糊集理論中的狀態特征值,將預測狀態轉化為預測結果,公式為:
(5)
(6)
式中:di為本期預測的max{Pi}狀態權重;ξ為最大概率作用指數,一般ξ=2或ξ=4,本文取ξ=2;H為max{Pi}時狀態i對應的級別特征值。
預測殘差
(7)
式中Ti、Bi分別為預測狀態i對應的區間上限、區間下限。
通過加權馬爾科夫模型預測殘差,修正ARIMA模型預測的第t期貨運周轉量
(8)

2.1.1 數據選取
貨運量與貨運周轉量反映某地區在一定時間內的物流活動情況,貨運量是一定時期內運輸的實際貨物總量,貨運周轉量包括貨物數量和貨物要求運輸的距離,更能體現對物流運輸的需求[13-15]。選取國家統計局公布的我國1990年1月至2021年12月的貨運周轉量數據進行分析,共計384期,每月為1期。貨運周轉量時序圖如圖1所示[16]。由圖1可知:第145期(2002年)前貨運周轉量平穩增長,之后出現大幅增長;每年2月的貨運周轉量均下降明顯。我國的貨運周轉量呈非平穩的周期性增長。對貨運周轉量進行差分處理,經1階差分及平穩性檢驗發現,序列的增長趨勢消失,顯示一定的平穩性。

圖1 貨運周轉量時序圖
2.1.2 模型識別
為確定模型階數[17],在統計應用軟件R中繪制原貨運周轉量序列的自相關系數圖和偏自相關系數圖,如圖2所示。

a)自相關系數 b)偏自相關系數 圖2 原貨運周轉量序列的自相關系數圖和偏自相關系數
由圖2可知:1階差分后自相關系數與偏自相關系數均拖尾,采用ARIMA(p,q)模型。根據最小信息準則,采用赤池信息準則(Akaike information criterion,AIC)和貝葉斯信息準則(Bayesian information criterion,BIC)確定p、q,均支持原貨運周轉量序列的ARIMA(2,1,2)模型,即1階差分序列的ARIMA(2,2)模型最優。
2.1.3 ARIMA模型預測結果
確定模型階數后,估計ARIMA模型的系數,擬合結果為:AR(1)、AR(2)、MA(1)、MA(2)的系數分別為1.489 3、-0.555 9、-1.909 8、0.937 7;標準差分別為0.174 0、0.049 5、0.034 5、0.029 9。ARIMA模型系數的絕對值大于3倍標準差,系數均顯著。因此可得ARIMA(2,1,2)模型為:
yt=2.489 3yt-1-2.045 2yt-2+0.555 9yt-3+εt-1.909 8εt-1+0.937 7εt-2。
根據擬合的模型,可得ARIMA模型預測貨運周轉量序列。
ARIMA模型預測的貨運周轉量序列與實際貨運周轉量序列之差構成殘差序列,該序列可看作一組具有平穩性與無后效性的隨機變量[18-20]。采用加權馬爾科夫模型修正殘差序列,將修正后的殘差序列與ARIMA模型預測的貨運周轉量序列相加,計算修正預測貨運周轉量。
2.2.1 狀態分級
經計算殘差序列的均值為-41.6,標準差為456.3,依據均值-標準差法,將殘差序列分為7個狀態區間,如表1所示。

表1 殘差序列的狀態區間劃分
2.2.2 計算轉移概率矩陣
根據殘差序列的轉移情況進行統計,得到一步轉移頻數矩陣p,計算一步轉移概率矩陣p(1),結果為:
p·j為p的第j列之和除以各行各列總和,經計算邊際概率p·1=0.257 2,p·2=0.057 4、p·3=0.235 0、p·4=0.305 0、p·5=0.149 0、p·6=0.078 0、p·7=0.068 0、p·8=0.050 0。參照一步轉移概率矩陣,同理可計算出二至七步轉移概率矩陣p(2)~p(7)。
2.2.3 馬氏性檢驗

2.2.4 預測殘差
根據式(2)(3)計算殘差序列的各階自相關系數及歸一化后的各階權重,結果如表2所示。

表2 各階自相關系數及權重
將歸一化后的各階權重作為對應滯期的權重,以第1~372期的殘差數據為樣本數據預測第373~384期的殘差。例如預測373期殘差狀態如表3所示。根據式(4),結合表3數據計算可得狀態1~7的Pi分別為0.015 4、0.032 9、0.008 8、0.188 8、0.216 1、0.406 9、0.131 1,max{Pi}=0.406 9,依據最大概率隸屬度原則判定,第373期的殘差狀態為6,分布在區間[415,877)。

表3 預測第373期殘差狀態
通過式(5)計算狀態1~7的di,結果為:d1=0.008 9,d2=0.004 1,d3=0.008 8,d4=0.133 7,d5=0.175 2,d6=0.621 4,d7=0.064 5。基于模糊集理論中的狀態特征值,采用式(6)計算狀態特征值H=5.600 31,依據式(7),得第373期的預測殘差z=422.569 億t·km。
ARIMA模型捕捉的是數據間的線性關系,只需內生變量,使用簡單,但對外界的影響,如政策調控或突發事件造成的劇烈沖擊很難預測。貨運周轉量具有明顯的周期增長性,且易受外界影響,可采用加權馬爾科夫模型預測的殘差體現這種非線性變化。根據加權馬爾科夫模型預測的第373期殘差,采用式(8)將該殘差與ARIMA模型預測的貨運周轉量相加,得到加權馬爾科夫-ARIMA修正模型預測的第373期的貨運周轉量,為17 186.72 億t·km。依次計算第374~384期的殘差及修正預測貨運周轉量,實際貨運周轉量Fp與ARIMA模型、加權馬爾科夫-ARIMA修正模型預測的貨運周轉量Ff對比結果如表4所示。

表4 第373~384期的實際貨運周轉量與2種模型預測的貨運周轉量
ARIMA模型與加權馬爾科夫-ARIMA修正模型的平均相對誤差分別為3.15%、2.22%,經修正后提高了模型的預測精度,加權馬爾科夫-ARIMA修正模型的預測精度優于單一的ARIMA模型。
本文以我國1990年1月至2021年12月的月度貨運周轉量為預測物流需求的基礎數據,構建時間序列的ARIMA模型,采用加權馬爾科夫模型修正殘差序列,建立加權馬爾科夫-ARIMA修正模型,以2021年1月至12月(即文中的373至384期數據)共12期貨運周轉量為例進行實證分析。結果顯示加權馬爾科夫-ARIMA修正模型的預測精度優于單一ARIMA模型。加權馬爾科夫-ARIMA修正模型可提高區域物流需求預測結果的準確性,為物流決策人員提供可靠的決策依據,也可為其他領域的預測研究提供借鑒。