詹 蕓,馬佳玉,張 陵
(1. 西安汽車職業大學,陜西 臨潼 710038;2. 西安交通大學,陜西 西安 710048)
“一帶一路”戰略使陜西成為中國向西開放的中心區域和重要節點,陜西省物流樞紐地位重要性日益凸顯,物流需求預測在物流發展規劃、物流資源整合等方面發揮著重要作用。物流與各影響因素之間表現為隱含的、錯綜復雜的非線性數學映射關系,物流需求的預測涉及數據統計技術、計算機技術等,因此建立可靠、高效及精準的陜西省物流需求預測模型面臨巨大的挑戰。
目前,研究學者構建物流需求預測模型的方法主要分為傳統預測方法和現代預測方法。傳統預測方法主要包括增長率法、指數平滑法、差分自回歸移動平均法等,其中增長率法、指數平滑法默認物流發展為穩定的增長態勢,無法準確預測發展趨勢多變的短期物流需求,差分自回歸移動平均法僅可以建立物流與各影響因素之間的線性關系,預測效果存在偏差。現代預測方法主要包括灰色預測模型、神經網絡、支持向量機(SVM)等方法,可以建立物流需求與各影響因素之間的非映射關系,預測效果更為準確。相較于SVM 模型,灰色預測模型、神經網絡方法本身理論架構存在不足,模型在初始階段狀態產生誤差。SVM 模型以結構風險最小作為算法準則,在小樣本、非線性的物流需求預測中表現出良好的適應性。然而傳統的SVM 模型在處理高重疊、高緯度的樣本數據時,計算速度與效果都會受到影響,整合樣本數據、降低數據維度是提高SVM 模型預測效率與準確性的重要步驟。
1.1 因子分析模型(FA)。因子分析是當前較為常用的多變量統計方法,研究變量間的相互依賴關系,把錯綜復雜及緊密聯系的變量綜合成少數公因子的統計方法。基于降維的理念,確保指標信息不丟失的前提下,用較少的公因子指標取代諸多原始指標,使原始的指標體系結構更加簡潔易操作,有利于后期指標體系綜合評價分析。
因子分析的原理就是把每個研究變量分解成兩部分因素,一部分由為代表全部變量共同特征的少數幾個公因子F 組成,另一部分是每個變量獨自具有的特征,即特殊因子ε。因子分析模型如式(1)。

通過定義核函數K (xx)=φ (x)·φ (x)(φ (x)為非線性函數),將樣本數據變換到高維空間進行線性回歸,在實際應用過程中,將非線性回歸函數轉化為其對偶問題進行求解。
在進行物流需求預測時,影響預測效率及準確性的因素眾多,影響多為非線性、隨機性的,同時樣本數據維度過高,單一預測模型預測效率低、結果穩定性差。由于FA 模型可以對物流的樣本數據進行整合、降低樣本維度,SVM 預測模型又可以表征物流需求的非線性、隨機性;故此,為了解決物流需求預測模型中的難題,本文提出了FA-SVM 模型,首先構建多影響因素下陜西省物流需求指標體系,并采用因子分析方法(FA) 對數據樣本進行降維處理,選取累計貢獻度較高的指標,用于反映需求量變化情況;其次采用SVM 模型對2010~2017 年的陜西省物流數據進行訓練,確定核函數,用2008~2009 年數據進行模型修正,2018 年數據進行過模型驗證;最后對2019~2020 年的陜西省物流需求情況進行預測,具體過程如圖1 所示。

圖1 FA-SVM 的物流需求預測流程
從陜西省的經濟水平、貿易水平、服務供給水平3 個角度選取影響因素。對選取影響指標進行收集整理,得到物流需求量指標體系如表1 所示。

表1 物流需求量指標體系圖
3.1 區域物流需求指標體系構建。本文中涉及到的數據主要來源于陜西省2008~2018 年相關部門統計年鑒以及國家統計局公布數據,如圖2 所示。

圖2 2008~2018 年物流需求量指標變化圖
使用SPSS 軟件對區域物流需求量指標體系進行因子分析,得到KMO 和巴特利特檢驗結果、初始值為1 的X~X指標累計貢獻率,如表2、表3 所示。

表2 KMO 和巴特利特檢驗

表3 累計貢獻率
由表2 可知,KMO=0.63>0.5,說明所選指標關聯性強,且巴特利特球形度檢驗Sig.<0.01,證明各指標相關系數矩陣不為單位矩陣,各指標間存在關聯性。由表3 可知,X~X均與Y、Y有密切相關性,其中X、X、X、X、X、X、X對研究對象的累計貢獻率達到94%,X、X的累計貢獻達到70%,證明所選取的指標可靠有效,數據質量較好,構建區域物流需求指標體系,可用于反映需求量變化情況。
3.2 SVM 模型參數及適用性評價。將陜西省各物流需求影響因素作為模型的輸入量,分別以客流量、貨流量作為輸出,在訓練和預測過程中,確定本次SVM 模型的約束函數及核函數,以2010~2017 年預測結果的誤差(均方根誤差、平均絕對誤差)作為評價預測效果的標準。
通過多次訓練驗證,確定核函數為徑向基核函數(RBF Kernel),相關參數表4。其中Kernel Scale 為SVM 模型參數Sigma,即“內核寬度”,該參數為徑向基核函數的主要表征參數,表明模型核函數選取準確;R均大于98%,表明模型擬合效果較好。

表4 SVM 模型核函數參數表
經過SVM 模型處理后,得到2010~2017 年貨運量及客運量的預測結果,如圖3、圖4 所示。

圖3 客運量預測結果擬合圖

圖4 貨運量預測結果擬合圖
從客運量、貨運量預測圖來看,預測模型擬合程度高,變化趨勢表征明顯,證明本文研究對象的影響因素指標選取得當,能夠很好地反映客、貨運量的變化趨勢。在后續對本地區物流發展情況進行研究時,可根據不同領域影響因素指標的重要程度著手調節管控,從而提高區域物流水平。
根據表5 SVM 模型得出的預測結果與真實值的誤差分析可得,Y貨運量、Y客運量的MAPE 分別為2.23%、1.21%,表明預測值與真實值之間誤差極小,模型選取合適。

表5 預測結果誤差表
3.3 FA-SVM 模型在陜西省物流預測中的應用。依據FA-SVM 的區域物流需求預測模型,對2018~2020 年陜西省貨運量Y及客運量Y進行預測,預測結果與實際值如表6 所示。2018 年Y、Y預測值與實際值的誤差分別為3.85%、2.83%,2019 年Y、Y預測值與實際值的誤差分別為6.39%、5.46%,預測效果整體較為準確;2020 年Y、Y實際值較模型預測發展趨勢差異較大,主要原因為新冠疫情嚴重降低了國內人員及貨物的流動性、國際航運和進出口冷鏈產品的貨運量。

表6 區域物流預測結果與實際值對比
隨著疫情防控形勢的好轉,疫情所帶來的影響會逐漸削弱,陜西省的貨運量及客運量仍將保持增長趨勢,建立穩定高效的應急物流服務體系將為物流業的發展提供可靠保障。
本文提出了一種“FA-SVM”新模型,并對陜西省近年物流需求展開了預測、分析和研究,主要得出以下結論:(1) 構建了經濟水平、貿易水平、服務供給水平三方面的陜西省區域物流需求量指標體系,通過因子分析發現地區生產總值(X)、物流業增加值(X)、物流業固定資產投資額(X)、區域消費零售總額(X)、區域進出口總額(X)、區域貨運周轉量(X)、區域旅客周轉量(X)等指標對陜西省物流需求的累計貢獻率高于94%,區域郵電業務量(X)、物流從業人數(X)等指標對陜西省物流需求的累計貢獻率高于71%,指標選取恰當,能夠反映區域物流變化趨勢特點。(2) 獲取整理了陜西省區域物流量數據集,將其應用于FA-SVM 模型的訓練、修正、驗證及使用,確定支持向量機模型的核函數為RBF Kernel,得到關于客運量(Y)、貨運量(Y)的R和MAPE 分別為0.9879 和0.9924、2.23%和1.21%,擬合效果優秀,模型選取恰當。(3) 運用FA-SVM 模型對2018~2019 年區域物流需求進行預測分析,得到2018 年客運量(Y)、貨運量(Y)預測值與實際值的誤差分別為3.85%、2.83%,2019年客運量(Y)、貨運量(Y)預測值與實際值的誤差分別為6.39%、5.46%。(4) FA-SVM 的區域物流需求預測模型有效改善了預測效率及精度,其對陜西省物流需求的預測結果良好,也為其他省市的物流需求預測提供了一種行之有效的途徑。