中圖分類號:0211 文獻標志碼:A 文章編號:2095-2945(2025)13-0046-05
Abstract:Withthevigorousdevelopmentofe-commercelogisticsnetworks,enhancinglogisticstransportationficiencyand reducinglaborcostshavebecomecoreelementsforthelogisticsindustrytostrengthenitscompetitivenessThisstudyfocuseson thecargovolumeforecastingfortransportroutesinthesortingcentersofe-commercelogisticsnetworks,aiming toacurately depictthedailyandevenhourlyfluctuationsincargovolumeoverthenext3Odaysthroughin-depthminingofhistoricalcargo volumedata.Specificall,wefirstconducted meticulouspreprocessingofdailycargovolumedatafromthepastfourmonthsand hourlycargovolumedatafromthepast3Odaysfrom57sortingcenters.Onthisbasis,weconstructedanAutoregresive IntegratedMovingAverage(ARIMA)modeltopredictthedailycargovolumeprofileoverthenext3Odays.Furthermore,we introducedaLong Short-TermMemory(LSTM)neuralnetworkmodeltoachieveprecisepredictionsof hourlycargovolumedata for the next 30 days.
Keywords: logistics network; transportation route;cargo volume profile; ARIMA model; LSTM model
現代物流是國民經濟的核心,對經濟發展至關重要,能促進市場繁榮、推動高質量發展。為確保貨物高效、準時、低成本送達,制定精確的分揀管理方案尤為關鍵。目前,學術界在物流需求預測方面已有深入研究,且我們掌握了多個分揀中心的歷史日貨量與小時貨量數據。基于此,本文構建了ARIMA和LSTM模型,旨在精準預測分揀中心未來的日貨量與小時貨量。該模型緊密結合實際,具有良好的通用性和廣泛的適用性,為分揀管理提供了有力的支持。
1數據預處理
本文采用的數據來源于\"2024年第十四屆Math-orCup數學應用挑戰賽\"官網,官網提供了57個分揀中心過去4個月每天貨量和過去1個月每小時貨量
數據?,F需要通過歷史貨量數據對57個分揀中心未來30天每天及每小時貨量進行預測。部分數據見表1和表2。


1.1異常值、缺失值的處理
按分揀中心分類數據,填充表2缺失值為日平均貨量,確保 2 4 h 數據完整,繪制箱線圖檢測異常值。以SC1、SC2、SC3為例,箱線圖如圖1和圖2所示。


貨量的原始貨量圖以觀察數據的平穩性,對原始數據進行ADF和KPSS2種檢驗,以SC8為例,結果如圖3和圖4所示。
圖1和圖2顯示部分數據點超出預設范圍,經分析,這些高值出現在“雙11\"期間,因電商大促引發訂單激增所致??紤]到“雙11\"期間貨量上升符合實際,我們決定不將這些個別高值視為異常數據處理


1.2 數據特征分析
1.2.1 白噪聲檢驗
白噪聲檢驗可以判斷一個時間序列是否是一個沒有記憶的序列,即檢驗過去的行為對將來的發展是否存在影響,選取Ljung-Box檢驗來實現,檢驗 m 階滯后范圍內序列的自相關性是否顯著。結果見表3。

從表3可以看出, H = 1 表明SC8序列是一個非白噪聲序列, P=0 . 0 0 3lt;0 . 0 5 ,因此拒絕原假設,即序列是純隨機序列。同樣顯著性水平為0.05的臨界值為1 . 9 6 lt; 2 6 . 5 0 8 ,因此拒絕原假設,說明序列存在研究價值。
1.2.2 平穩性檢驗
根據已知的歷史數據,分別繪制各分揀中心每天
原始數據圖顯示,貨量受節假日、促銷等活動影響,日貨量數據非平穩但小時數據近似平穩,故針對日貨量不平穩性,采用ARIMA模型預測。
1.2.3 周期性檢驗
繪制基于傅里葉變換的頻譜圖以分析時間序列的周期性和隨機性,分析得到貨量與時間之間存在的特征關系,SC8分揀中心的頻譜圖如圖5和圖6所示。

每天數據頻譜圖平坦,表明信號頻率分布均勻,缺乏顯著周期性,體現數據隨機性。每小時數據在時頻上具強相關性,尤其是長期依賴,且時間間隔短,ARIMA模型難捕捉其相關性。因此,選用LSTM模型預測未來30天各分揀中心貨量情況。

2基于ARIMA模型的預測模型建立
2.1ARIMA模型基本概述
ARIMA模型是一種時間序列預測模型,由自回歸(AR)整合(I)和移動平均(MA)3部分構成,分別對應參數
。它通過識別歷史數據規律,構建數據變動模型預測未來。其中,AR反映當前值與過去值關系;I通過差分實現數據平穩;MA捕捉殘差特征,利用歷史預測誤差加權平均預測未來值。數學表達式如下


前半段為AR模型,后半段是MA模型中關于波動的部分[3。為確定ARIMA模型的3個參數及使用模型進行預測需要實現的步驟流程圖如圖7所示。
2.2確定ARIMA模型參數 d
為了確定參數 d ,對原始數據進行ADF和KPSS2種檢驗,以SC8為例,結果見表4。
SC8貨量數據ADF檢驗為0、KPSS為1,均示非平穩,一階差分后兩檢驗值變,序列平穩, d=1 。


2.3 確定ARIMA模型的參數 
以分揀中心SC8為例,繪制自相關圖(ACF)和偏自相關圖(PACF)來確定 p , q 參數,如圖8所示。

由圖8可知,ACF圖和PACF圖都是一階截尾,因此確定 p = 1 , q = 1 ,使用ADF和KPSS2種檢驗方式確定差分階數為1,由此確定模型為ARIMA(1,1,1)。
2.4 ARIMA模型的檢驗
為檢驗上述ARIMA(1,1,1)模型的優劣,繪制預測值與真實值之間差距的圖像,并計算相對誤差來衡量模型是否可靠,如圖9所示。

從圖9中可以看出,預測值與真實值之間的差距較小,通過計算得出的相對誤差數值為0.2586,這表
明模型的性能較為優越。
2.5 預測結果
通過ARIMA(1,1,1)時間序列分析模型來捕捉并預測未來30天每天貨量的動態變化趨勢,得到結果如圖10所示。

由圖10可知,預測結果都在置信區間范圍內,說明模型的預測結果較為精準,體現了其預測結果的穩健性與可信度,預測結果良好。
3基于LSTM長短期記憶網絡預測模型的建立
3.1LSTM模型基本概述
LSTM是特殊RNN,擅長處理時間序列數據的長期依賴關系,能高效捕捉物流網絡中貨量預測的線性與非線性特征,提升預測準確性。其遺忘門、輸入門、輸出門機制精確控制記憶細胞,增強記憶、學習和預測能力。作為逐點預測方法,LSTM減少信息遺失,更準確反映數據變化趨勢。門控機制的具體結構如圖11所示。

圖11中 × 就是操作矩陣中對應的元素相乘, + 則代表進行矩陣加法, x ( t ) 為當前時刻的輸入, C ( t-1 ) 是上一時刻細胞狀態, C ( t ) 為新的細胞狀態, h ( t-1 ) 為上一時刻隱藏層狀態, h (t)為新的隱藏層狀態,sigmoid為激活函數σ(x)=1
,非線性激活函數

遺忘門允許LSTM在處理序列時選擇性地遺忘之
前的信息,決定負責遺忘記憶單元中多少記憶得以保存。數學表達式如下

輸入門充許新的信息流入LSTM的記憶單元,并決定哪些新信息是有價值的,可以加入到記憶中。具體數學表達式如下


輸出門的輸出值決定了輸出的信息量,0則無輸出,1則全輸出當前記憶狀態。這種機制使得LSTM能夠靈活地調整輸出信息量,以適應不同的任務需求。數學公式如下


3.2 LSTM模型的檢驗
使用LSTM模型進行訓練,輸入數據依次通過遺忘門、輸入門和輸出門,得到收斂狀態的模型訓練結果,繪制訓練集、測試集、預測值的圖像,結果如圖12所示。

圖12顯示預測值與真實值差距小,為驗證模型性能,計算RMSE和SMARE衡量LSTM模型誤差。以分揀中心SC8為例,結果見表5,用于評估預測準確性。

RMSE(均方根誤差)是衡量預測誤差的關鍵指標,SC8的RMSE值為327.61,表明預測誤差平均327.61個單位,相對于每小時2000左右的貨量,誤差較小。SMAPE(對稱平均絕對百分比誤差)值為0.085,顯示預測值與真實值間相對誤差極小,為高度準確預測。綜上,該模型在RMSE和SMAPE指標上均表現優異,預測準確性高。
3.3 預測結果
LSTM模型作為一種數據驅動的動態預測模型,用于捕捉并預測了時間序列數據中的關鍵特征,借助LSTM模型,我們得到57個分揀中心未來30天每小時的貨量,結果如圖13所示。

由圖13可以看出,未來30天的預測結果與歷史數據近期的波動趨勢相似,因此模型有效地學習和捕捉了時間序列數據的內在規律,對未來的決策提供有價值的參考。
4結論
本文著重研究物流網絡分揀中心的貨量預測難題,通過深入剖析歷史數據,旨在精確預測未來一個月內每一天及每一小時的貨量。為實現這一目標,我們建立了ARIMA模型和LSTM模型,以全面把握未來一個月的貨量動態。預測結果的合理性分析證實了模型的有效性。這些模型的有效運用,對提升物流網絡的運輸效率、降低物流成本以及優化運輸流程均產生了積極影響。
參考文獻:
[1]張奔.可持續城市物流發展評價與預測研究[D].西安:西安電子科技大學,2022.
[2]李玲玲,辛浩.時序模型ARIMA在數據分析中的應用[J].福建電腦,2024,40(4):25-29.
[3]程元棟,喻可欣,李先洋.基于加權馬爾科夫-ARIMA修正模型的區域物流需求預測[J].山東交通學院學報,2023,31(3):22-28.
[4]WEN Z,SHANG Y,WU Y.Research on Cargo VolumePrediction and Optimisationof E-Commerce LogisticsNetwork Based on LSTM [J].World Scientific ResearchJournal,2024,10(4):62-68.