




摘" 要:現代物流產業作為我國經濟發展的支柱產業之一,物流產業發展可以提高勞動的生產效率降低資源消耗,是經濟高速發展的基礎。為了科學合理制定物流產業發展規劃,需要準確預測市場對物流的需求量,根據物流需求情況來制定物流發展目標,才能更好滿足經濟發展的需求。文章對江蘇省1990—2021年經濟發展數據進行研究分析,借助于機器學習方法,構建了經濟指標與物流需求之間關系的支持向量回歸(SVR)黑箱模型。針對SVR核函數參數難以確定的問題,采用遺傳算法對其尋優,并與DE-SVR、GS-SVR和LS等方法對比貨運量回測結果,基于遺傳算法優化的SVR黑箱模型(GA-SVR)具有精度高、訓練速度快的優點,更適用于當前物流需求數據集。通過GA-SVR建立了貨運量時間序列的預測模型,對2019—2021年貨運量進行預測,預測結果與真實值之間最大誤差僅為3.45%,證明了所訓練時間序列模型的有效性和泛化性能,并采用預測模型預測了江蘇省未來三年貨運量。
關鍵詞:物流需求;數學模型;指標體系;預測對比
" 中圖分類號:F259.27" " 文獻標志碼:A" " DOI:10.13714/j.cnki.1002-3100.2025.05.026
Abstract: The modern logistics industry is one of the pillar industries in China's economic development. The development of the logistics industry can improve labor productivity and reduce resource consumption, serving as the foundation for the rapid economic development. To formulate a scientific and reasonable logistics industry development plan, it is necessary to accurately predict the market demand for logistics and set logistics development goals based on the logistics demand situation, so as to better meet the requirements of economic development. By conducting research and analysis on the economic development data of Jiangsu Province from 1990 to 2021 and with the aid of machine learning methods, a support vector regression(SVR)black-box model of the relationship between economic indicators and logistics demand was constructed. In view of the difficulty in determining the parameters of the SVR kernel function, the genetic algorithm was adopted to optimize them. And by comparing the backtesting results of freight volume with methods such as DE-SVR, GS-SVR and LS, the SVR black-box model optimized by the genetic algorithm(GA-SVR)has the advantages of high precision and fast training speed, and is more suitable for the current logistics demand data set. Through GA-SVR, a prediction model for the time series of freight volume was established to predict the freight volume from 2019 to 2021. The maximum error between the predicted results and the actual values was only 3.45%, which proved the effectiveness and generalization performance of the trained time series model. Moreover, the prediction model was used to predict the freight volume of Jiangsu Province in the next three years.
Key words: logistics demand; mathematical model; index system; forecast comparison
0" 引" 言
物流行業作為國民經濟發展的基礎行業,近年來物流行業的快速發展,對經濟促進、物資供應和產業調整等方面起到了積極的促進作用。物流發展預測對物流行業有著重要意義,因此國內外學者對影響物流的因素從不同的角度進行了系列研究,并采用機器學習方法預測未來物流發展趨勢。賈海成等[1]運用多元回歸分析和灰色預測法對1995—2009年江蘇物流需求量進行預測,同時結合Shapley值法進行組合預測了2010—2015年期間物流需求的變化情況,預測出具體增長值。曹志強等[2]采用支持向量回歸機結合遺傳算法(GA),優化了系列預測參數,對1990—2015年廣西貨運量進行了評價預測,通過對比驗證了構建模型的準確性。曾煜等[3]考慮了各類影響因素下的物流影響,運用RBF神經網絡進行系統預測,并驗證了所構建預測模型的精確度,通過對比發現平均絕對誤差僅為2.41%。趙文德等[4]考慮諸多影響指標后,建立了ARIMA模型和BP神經網絡模型對廣東省物流需求進行了預測和對比分析。吳玉國等[5]以南京市2010—2019年公路貨運周轉量為研究對象,通過構建灰色馬爾科夫組合預測模型對物流需求進行了系統的預測分析。尹宗明等[6]以滄州市2012—2018年的物流數據為基礎構建了灰色GM1,N模型,通過對比分析驗證了預測模型的精確度。左雷等[7]在考慮經濟因素和非經濟因素的基礎上,以湖北省孝感市的物流需求為研究對象,建立了DGM1,1模型進行了系統預測。諸多研究表明區域物流需求預測是指根據過去和現在的物流需求狀況,考慮影響物流需求變化因素之間的關系,運用科學的方法、手段,對物流需求未來的發展變化趨勢做出科學的估計和描述。
" 當前,我國物流需求在社會發展的促進下穩步提升,根據相關研究顯示2015—2022年中國快遞、物流服務行業業務量保持穩定上升的趨勢。2021年由于疫情的反復,中國快遞服務企業業務量以29.9%的增速增長至1 083.1億件。截至2022年6月30日,全國快遞業務量已突破512.2億件,同比增長率為3.7%。中國快遞業務累計收入達到4 982.2億元,同比增長2.9%[8]。研究區域經濟和區域物流的預測,選取合適的研究對象十分重要,江蘇省作為全國的經濟大省、長三角經濟圈的重要組成部分,是國家“一帶一路”、長江經濟帶、國家自貿區等重大戰略的交匯地,地區區域經濟也與物流發展水平高度相關,基于此,本文結合江蘇省物流發展現狀,基于江蘇省1990—2021年數據為研究基礎上,采用了GA-SVR構建回歸模型,對貨運量與經濟發展指標建立映射關系,并進行對比驗證。同時,預測疫情后時代的未來三年江蘇省物流數據,預測數據可以為政府部門、行業和企業等提供相應決策依據。
1" 支持向量回歸及其參數尋優
1.1" 支持向量回歸原理
1.2" 遺傳算法與參數尋優
遺傳算法(Genetic Algorithm,GA)是一種典型的仿生學智能優化算法。自20世紀60年代被提出之后,GA一直受到國內外學者的廣泛關注,并逐漸發展成為兼顧解決單目標和多目標優化問題的“進化算法”。在使用SVR等一系列機器學習算法訓練黑箱模型時,若使用傳統的網格搜索法(Grid Search,GS)對模型參數或訓練超參數尋優,其網格劃分間隔會影響優化精度,過細的網格也會大大耗費計算時間。將GA引入到SVR參數尋優中,可以在保證模型精度的前提下加快訓練速度。
" 遺傳算法的優化流程分為編碼、適應度計算、選擇、交叉等步驟。SVR需要尋優的參數為核函數尺度參數γ和容錯誤差ε,則基于遺傳算法的SVR參數優化過程如圖1所示。對于該迭代過程,使用K折交叉驗證對當前SVR模型進行評估,將交叉驗證誤差最小的模型所對應的核函數參數選擇成為優勢個體。
2" 模型構建與預測
" 將1990—2021年江蘇省區域經濟發展指標的32組數據劃分訓練集和測試集。從2021年開始,倒序采用等間距抽樣,選取測試集數目占總數據集的20%,即1996、2001、2006、2011、2016、2021這六年的樣本,用剩下80%樣本進行訓練;基于遺傳算法對γ,ε參數組合尋優,編碼形式為二進制,種群數目為50,令γ
∈0.001,50,ε∈0.001,0.5,以10折交叉驗證誤差最小作為適應目標,對所構建SVR黑箱模型的精度進行評估。選擇差分進化算法(Differential Evolution,DE)和網格搜索法(Grid Search,GS)兩種優化算法作為對比分析方法,其中差分進化算法(DE)與遺傳算法(GA)尺度參數γ和容錯誤差ε設置完全相同,網格搜索法(GS)由于效率較低而選取0.02為間隔進行優化,三種方法的尋優結果及計算時間具體如表1所示。
由表1可知,GA算法對SVR參數尋優性能較好,GA算法和DE算法的交叉驗證誤差相近,都比GS算法精度高,GA算法比其他兩種算法的計算速度快。DE算法所得模型精度最高,但優化耗時大,模型精度相對GA算法的提升極小。總的來講,GA算法兼容了計算精度和計算效率兩個方面優點,在后續尋優計算過程中,采用遺傳算法(GA)作為最優參數選擇算法。
取GA得到最優參數組合到訓練模型SVR黑箱模型之中,其中參數松弛變量的懲罰項系數C對支持向量回歸結果幾無影響,取C=106表示回歸過程僅容許較小誤差。用GS-SVR和最小二乘法(Least Square Method,LS)所構建的回歸模型作對比,如圖2所示;測試集中每個樣本的具體誤差對比如表2所示。可以看出,GA-SVR模型對測試集樣本的預測值更接近真實值,預測誤差更小。使用該模型對所有樣本進行預測,預測結果見圖3。圖3中SVR預測貨運量走勢與真實值較為接近,證明了所構建地區經濟指標與貨運量黑箱模型的有效性。
" 本文的主要目的不僅是為了建立江蘇省區域貨運量與經濟發展指標的映射關系,還應包括對未來貨運量的預測。將各年貨運量當作一維時間序列,可以構建貨運量與時間的回歸關系,從而達到預測未來的作用。使用RBF核函數,用1990—2017年的貨運量作為樣本輸入,1991—2018年的貨運量作為樣本輸出,訓練GA-SVR模型;以2018—2020年貨運量作為測試輸入,則作為測試輸出可以得到2019—2021年貨運量預測值(見圖4),表3是這3年貨運量預測值與真實值的誤差。然后對構建的模型輸入2021年的貨運量,可得2022年貨運量的預測值,將該預測值繼續輸入并依次迭代,可分別對2023年、2024年貨運量進行預測,模型預測結果如表4所示。
由圖4和表3可知,基于GA優化的SVR黑箱模型對于江蘇省區域貨運量時間序列具有良好的學習精度和泛化性。其中,使用1990—2018年數據對2019—2021年貨運量預測時,最大預測誤差僅為3.45%。基于GA優化的SVR黑箱模型對于未來三年江蘇省區域貨運量具體見表4,為政府、企業等單位做決策提供了科學參考依據。
3" 結" 論
本文以江蘇省區域經濟發展指標數據為研究基礎,分析了1990—2021年的數據,結合諸多指標:地區生產總值、居民消費水平、第一產業產值、第二產業產值和第三產業產值等,建立了反映經濟指標與物流需求之間關系的SVR黑箱模型。其中,針對SVR核函數參數難以確定的問題,采用遺傳算法(GA)對其尋優。與DE-SVR、GS-SVR和LS等方法對比貨運量回測結果,基于遺傳算法優化的SVR黑箱模型(GA-SVR)具有模型精度高,訓練速度快的優點,更適用于當前物流需求的數據集。
" 將1990—2018年間貨運量數據視為一維時間序列,使用GA-SVR建立了貨運量時間序列的預測模型,并回測了模型對2019—2021年的預測結果,最大預測誤差僅為3.45%,證明了所訓練時間序列模型的有效性和泛化性能,并給出了對未來三年(2022—2024年)江蘇省年貨運量的預測結果。
參考文獻:
[1] 賈海成,秦菲菲. 區域物流需求預測研究——以江蘇省為例[J]. 中國物流與采購,2012(3):68-69.
[2] 曹志強,楊箏,劉放. 基于遺傳算法優化支持向量回歸機的區域物流需求預測[J]. 系統科學學報,2018,26(4):79-82,90.
[3] 曾煜,朱志浩. 基于RBF神經網絡的區域物流需求預測[J]. 綜合運輸,2020,42(6):90-93.
[4] 趙文德,黃麗娟,胡子瑜. 基于BP神經網絡組合模型的廣東省區域物流需求能力預測[J]. 物流技術,2020,39(12):49-56,66.
[5] 吳玉國,李曉迪. 基于灰色-馬爾科夫鏈的區域物流需求預測[J]. 南陽理工學院學報,2020,12(6):1-5.
[6] 尹宗明,杜學敏. 基于灰色GM1,N模型的區域物流需求預測研究[J]. 物流科技,2021,44(3):104-105,117.
[7] 左雷,徐柏安. 區域物流需求影響因素實證分析及總量預測——以湖北省孝感市為例[J]. 物流技術,2020,39(12):39-44.
[8] 艾媒咨詢. 2022—2023年中國快遞物流行業發展現狀及典型案例研究報告[R]. 廣東:艾媒研究院,2022.
[9] 周志華. 機器學習[M]. 北京:清華大學出版社,2018.