郭楊莉



摘 要:以福建省物流需求為研究對象,選取福建省1996—2015年貨物吞吐量、全社會固定資產投資總額、農林牧漁總產值、進出口商品總額、居民消費水平、地區生產總值等統計數據,基于多元線性回歸思路,診斷多重共線性。采用逐步回歸法,以SPSS軟件為工具, 建立貨物吞吐量與全社會固定資產投資總額以及進出口商品總額的二元線性回歸模型。通過統計分析檢驗模型的有效性,運用貨物吞吐量觀測值與預測值的殘差及相對誤差檢驗模型的實踐性。
關鍵詞:多元線性回歸 物流需求預測 逐步回歸 多重共線性 異方差
一、緒論
(一)研究背景及意義
區域物流是經濟活動的動脈,是聯系生產和消費的紐帶,是社會發展和人民生活水平提高的基礎條件,也是衡量一個國家現代化程度的重要標準之一。
早在2009年國務院就宣布了我國的十大產業振興規劃,其中就有物流產業。2011年3月,我國“十二五”規劃綱要中仍然將發展現代物流納入其中。可見,我國非常關注物流業。隨著地方政府紛紛采取促進物流發展的相關措施,物流業得到了飛速發展。發展物流業是優化產業結構和轉變發展方式的必要條件。可以提升經濟水平,壯大現代服務業的規模;可以降低企業成本,改善企業組織方式。由此可見,研究區域物流有著重大意義。
(二)貨運量預測的國內外研究現狀
在貨運量預測方面,目前國內外應用的各種定性以及定量的方法已達上百種。主要的基本模型集中在時間序列法、回歸分析法、指數平滑法、神經網絡法、灰色模型法、ARIMA法等方法上。
國外對貨運預測方面的研究開展較早,所以國外關于貨運量預測模型方面的研究比較多,其理論及實際經驗要遠比國內成熟.Gregory A.Godfrey和Warren B.Powell(2000)以指數平滑法為基礎,提出了一系列預測方法,與ARIMA方法相比,這一系列的預測方法操作更為簡單、易行,并且在預測方面有著更高的精確度。
國內學者在貨運量預測方面的研究相對較晚,但國內關于貨運量預測的研究成果也不少,如:郭玉華等人(2010)對經濟周期階段參數的內涵進行闡述,并將經濟周期進行量化,作為一個輸入因素,建立基于經濟周期的Elman神經網絡預測模型,以我國1992-2008年鐵路貨運量為實例,對預測模型進行檢驗。
二、實證分析
(一)模型指標的選取
物流需求是指一定物流需求是指一定時期內社會經濟活動對生產、流通、消費領域的原材料、成品和半成品、商品以及廢舊物品、廢舊材料等的配置作用而產生的對物流在空間、時間和費用方面的要求,涉及運輸、庫存、包裝、裝卸搬運、流通加工以及與之相關的信息需求等[16]。考慮到運輸是現代物流體系的中心環節, 以及獲取數據的完整性、一致性和時效性等方面因素,本文選取1996-2016年福建省統計年鑒上的數據作為樣本數據,選取物流貨運量(萬噸)為物流需求指標Y,選取全社會固定資產投資總額X1(億元)、農林牧漁總產值X2(億元)、進出口商品總額X3(千萬美元)、居民消費水平X4(元/人)、地區生產總值(億元)X5等5個因素為物流需求預測的經濟指標[17]。
(二)多重共線性診斷
多重共線性是指線性回歸模型中的解釋變量之間由于存在精確相關關系或高度相關關系而使模型估計失真或難以估計準確。一般來說,由于數據的限制使得模型設計不當,導致設計矩陣中解釋變量間存在普遍的相關關系。完全共線性的情況并不多見,一般出現的是在一定程度上的共線性,即近似共線性。
在多元線性回歸模型中,自變量之間可能存在線性相關的關系,會使得系數估計的標準誤差增大,從而使得模型的預測精度大大降低。使用SPSS軟件全回歸法對所選取的指標建立模型,結果顯示如下:
S=(7950.893) (0.878)(12.823)(0.736)(1.936)(2.945)
t=(2.051) (3.873)(0.597)(2.778)(1.342)(-1.186)
p=(0.058) (0.002) (0.560)(0.014)(0.200)(0.254)
F=(814.603) P=(0.000)
R2=0.996
n=21 (df=15)
結果發現模型整體是顯著的,但是對模型系數的檢驗表明很多變量對“貨運量”的影響并不顯著。由以上結果可知,t統計量與Sig值均不顯著。自變量之間很可能存在共線性的問題。計算各解釋變量的相關關系并進行共線性診斷,從下表可以看出VIF遠大于10,各解釋變量間存在嚴重的多重共線性,因此考慮改用多元逐步回歸法對物流需求與各經濟指標建立模型, 減少多重共線性對模型參數估計、模型誤差以及穩定性等的影響。
(三) 多元逐步回歸
多元逐步回歸的基本思想是:對全部因子根據其對因變量Y影響程度的大小(即偏回歸平方和R2值的大小),從大到小逐個地引入回歸方程,同時對回歸方程當時所含的全部變量進行統計檢驗,觀察其是否仍然顯著,如果不顯著就將其移出模型,直到回歸方程中所有的變量對因變量Y的作用都是顯著的,再考慮引入新的變量。再在剩余的未選因子中,選出對因變量Y的作用最大者,檢驗其顯著性,若顯著則引入方程,若不顯著則不引入,直到最后再也沒有可以引入的顯著因子,也沒有不顯著的變量需要移除為止。 多元逐步回歸分析本質上沒有新的理論,只是在多元線性回歸內部運用一些計算技巧獲得最優的多元線性回歸方程,是實用且被廣泛應用的統計分析方法。
在逐步回歸中,變量X5、X1、X3被逐個引入,在第三個模型中X5被移除,最終得到模型4。模型4解釋變量為X1、X3,模型整體顯著(R2=0.996,F=2085.824,Sig=0.000),模型系數檢驗顯著。t1=15.973,Sig1=0.000;t2=7.324,Sig2=0.000,比較理想,同DW=1.976,模型不存在自相關性問題。解釋變量X1、X3的方差膨脹因子VIF=7.909,多重共線性問題已經消除。
(四)物流需求預測模型
由表3中的模型4可得物流需求預測回歸模型為:
Y=24544.827+2.951x1+1.650x3
其中X1為社會固定資產投資總額,X3為進出口商品總額(千萬美元)。模型整體檢驗顯著、模型系數檢驗顯著,具有一定的分析價值。由該模型計算得出1996-2016年物流貨運量預測值,由表4可知少數年份殘差較大。標準化殘差正態曲線直方圖如圖1所示, 標準化殘差概率圖如圖2所示。可以看出標準化殘差呈正態分布,散點在直線上或下靠近直線,回歸方程滿足線性以及方差齊次的檢驗,物流需求預測模型通過了實踐檢驗。
三、結論
基于1996-2016年福建省貨運量及相關統計數據建立的多元線性回歸模型, 表明福建省貨運量與全社會固定資產投資總額、進出口商品總額表現出高度的相關性。農林牧副漁總產值、居民消費水平、地區生產總值等經濟指標與貨運量也存在很強的相關關系, 但由于各變量間存在較強的多重共線性,在逐步回歸中被剔除。由偏邊際經濟理論可知,在進出口商品總額不變的情況下,全社會固定資產投資總額每增加1個單位,物流需求平均增長2.95個單位;社會固定資產投資總額不變的情況下,進出口商品總額每增加1個單位,物流需求平均增長1.650個單位。從模型可以看出,全社會固定資產資對物流需求的影響較大。
參考文獻
[1].Gregory A. Godfrey, Warren B. Powell. Adaptive estimation of daily demands with complex calendar effects for freight transportation[J]. Transportation Research Part B, 2000, 34(6):451-469.
[2].郭玉華, 陳治亞, 馮芬玲,等. 基于經濟周期的鐵路貨運量神經網絡預測研究[J]. 鐵道學報, 2010, 32(5):1-6.
[3]王治. 基于遺傳算法-支持向量機的鐵路貨運量預測[J]. 計算機仿真, 2010,