繆輝 羅露璐



摘 要:物流需求在物流業中起著至關重要的作用。根據貴州省近年的物流發展情況,文章選取2005 —2021年的貨運量、三次產業增加值等統計數據,運用R軟件建立多元線性回歸模型,并利用已有數據進行檢驗,該模型的預測精度較高。
關鍵詞:物流需求;多元線性回歸;預測分析
中圖分類號:F252;F224文獻標志碼:ADOI:10.13714/j.cnki.1002-3100.2023.08.021
Abstract: Logistics demand plays a vital role in the logistics industry. According to the development of logistics in Guizhou Province in recent years, this paper selects the statistical data of freight volume and tertiary industrial added value from 2005 to 2021, uses R software to establish a multiple linear regression model, and uses the existing data to test. The model has a good prediction accuracy.
Key words: logistics demand; multiple linear regression; predictive analysis
0 ? ?引 ? ?言
經濟的高效發展離不開現代物流業。貴州省地處我國西南地區,東靠湖南長株潭一體化、南鄰廣西北部灣經濟開發區、西毗云南及中國-東盟自由貿易區、北接川渝經濟區,得天獨厚的地理位置使貴州省物流業的發展十分迅猛。近些年,物流需求被許多學者廣泛研究。例如,梁艷明[1]利用回歸分析法建立了安徽省物流數據模型,并認為該模型可以應用于區域物流需求的預測。劉炯[2]對安徽省物流需求相關數據構建了多元線性回歸模型并提出了相關建議。王迪[3]對上海市物流需求的影響因素進行研究,結合上海市的物流發展現狀提出相關建議。綜上所述,本文運用多元線性回歸模型對貴州省的物流需求進行預測分析,同時根據分析結果提出針對性建議,促進了貴州省現代物流業的高速發展。
1 ? ?多元線性回歸模型
一般來說,在實際應用中,因變量會受到若干相關因素的影響,多元線性回歸表示它們之間的關系呈線性相關。一般形式表示為
其中β0為常數項,而β1,β2,...βn為回歸系數,ε為隨機干擾項。
2 ? ?指標選取及數據收集
2.1 ? ?指標選取
當前,行業內還沒有統一規范的統計指標來度量物流需求。故本文參考大量有關物流需求方面的文獻,在考慮數據來源科學性、可靠性和全面性的前提下,將因變量Y選取為貨運量這一指標。影響物流需求的因素多種多樣,結合貴州省物流需求的研究現狀和實際情況,選取以下影響物流需求的指標作為解釋變量,見表1。
2.2 ? ?相關指標說明
2.2.1 ? ?經濟發展水平
國內生產總值常用來衡量一個國家或地區的經濟狀況,它由第一、二、三產業增加值組成。物流基礎設施的固定投資部分也是影響物流發展的必要因素之一,同時物流需求對零售業的發展具有重要的支持作用。
2.2.2 ? ?對外經濟貿易
一個國家或地區的外貿規模和發展水平可以用進出口總額衡量,而進口或出口貿易都需要借助物流來實現。因此物流會影響國家或地區的對外經濟貿易水平。
2.2.3 ? ?人民生活水平
居民的人均可支配收入隨著經濟水平的提高不斷增加,這樣居民的購買力也增強了;為了適應多樣化和個性化的居民購買需求,相應的物流需求也日漸提高。
2.2.4 ? ?人口發展水平
人口發展水平反映了地區的人口規模,人口聚集地區相對經濟較為繁榮,而且物流行業在這些地區發展得也極好。故選用年末常住人口這一指標來衡量物流需求。
2.3 ? ?數據收集
本文收集了貴州省2005—2021年與物流相關的數據,數據來源于中國統計局官網、貴州省統計年鑒和統計公報。統計指標為貨運量(萬噸)、三次產業增加值(億元)等。
3 ? ?實證分析
3.1 ? ?模型構建
本文選取了貴州省2005—2021年的物流相關統計指標,因變量為貨運量,記為Y,其余指標為自變量,分別是全社會固定資產投資額(X1)、第一產業增加值(X2)、第二產業增加值(X3)、第三產業增加值(X4)、社會消費品零售總額(X5)、進出口額(X6)、居民人均可支配收入(X7)、年末常住人口(X8),建立多元線性回歸模型如下:
為了分析出哪些因素影響貴州省物流量,在建立多元線性回歸模型時,需要首先檢查各變量之間的相關性。通常,相關系數的絕對值大于0.8時,兩變量之間的線性關系很強。計算結果顯示,選取的變量之間有嚴重的多重共線性(見表2)。接下來,需要進一步對回歸模型進行研究,需要做假設檢驗,否則回歸模型會不穩定,會影響模型分析預測的精確度。
3.2 ? ?假設檢驗
3.2.1 ? ?正態性檢驗
正態分布檢驗可以檢驗總體數據是否呈正態分布,由圖1可見,點均在直線附近且在置信區間內,通過正態性檢驗可知本文所采用的指標數據均符合正態分布。
3.2.2 ? ?自相關檢驗
為了判斷線性回歸模型是否滿足要求,還需要做殘差的獨立性檢驗(自相關檢驗),對建立的模型進行DW自相關檢驗。結果可得,DW=2.124 881、P=0.072>0.05,說明因變量之間無自相關關系,殘差是相互獨立的。
3.2.3 ? ?線性關系檢驗
由圖2可知本文所選的數據適合使用線性模型。
3.2.4 ? ?同方差性檢驗
同方差性就是要求回歸殘差是隨機的,否則可能存在回歸設置或者變量選取等問題,需要修正。由圖3可得,超過95%的樣本點無趨勢地落在[-2,2]之間,并通過同方差性檢驗。
3.2.5 ? ?多重共線性檢驗
多重共線性通常在線性回歸分析時出現,易使回歸系數符號與實際情況完全相反,導致分析結果不穩定,所以需要消除多重共線性的影響。本文將采取全子集回歸選擇最終預測變量。
由圖4可知,模型含有截距項X3、X4、X6和X7時,調整R2為0.97,模型擬合最優。但是由于X6未通過t檢驗,因此將其刪除。對兩個模型的擬合優度進行比較,由于檢驗不顯著(P=0.101 7>0.05),變量X6可刪除。因此模型含有X3、X4、X7這三個變量即可。基于此,本文確定最優的貴州省物流需求模型為
3.3 ? ?預測分析
非標準化數據構建的非標準化回歸方程(3)是否有效,還需要進一步驗證,將表2中變量X3、X4、X7的原始數據直接代入回歸方程(3),同時預測2005—2021年貴州省的物流量,表3為貴州省物流需求預測值與實際值的對比結果。
一般普遍認為回歸模型的預測精度可以通過誤差率判斷,誤差率是預測值與實際值之差和實際值的比值,誤差率在10%以下,說明預測精度較高。從近17年的數據看,實際值與預測值相差不多,除了2005年、2008年和2010年,誤差率均在10%以下,最小的是2016年的0.88%。通過表3的分析結果可以看出,本文所選用的指標數據用來預測貴州省物流量是合適的,并且有較高的預測精度,為了使結果更加直觀,本文給出預測圖(圖5),從圖5可看出貴州省物流量穩步增加,2010年后增速加大。因此,只要預先獲取要預測年份貴州省第二產業、第三產業的增加值及居民人均可支配收入,就能預測該年度貴州省的物流需求。
4 ? ?結論與建議
本文運用多元線性回歸模型對貴州省2005—2021年的物流量及其相關數據進行預測分析,模型通過了有效的檢驗和預測,相對誤差極小、準確度較高,模型合理可用。其中,貴州省第二產業增加值對物流量的正向影響最大,而第三產業增加值和居民人均可支配收入對物流量有輕微的負向影響。貴州省應當積極建設新型物流基礎設施并構建集約、高效的現代物流服務體系,同時加強物流業與其他產業的融合,實現城市居民消費體系和物流需求的互惠雙贏。
參考文獻:
[1] 梁艷明.基于回歸分析方法的物流需求預測——以安徽省為例[J].廣西民族師范學院學報,2015,32(4):65-69.
[2] 劉炯.基于多元線性回歸的物流需求預測分析——以安徽省為例[J].四川文理學院學報,2022,32(2):51-58.
[3] 王迪.基于多元線性回歸模型的物流需求影響因素實證分析——以上海市為例[J].投資與創業,2022,33(14):58-60.