摘要:為提升小批量物料生產(chǎn)預測的精確性,文章構建并比較了三種主流時間序列預測模型:ARIMA、Prophet與LSTM。研究基于2019年1月—2022年5月的真實物料需求數(shù)據(jù),對三種模型的預測性能進行了實證評估。結果表明:在所選數(shù)據(jù)集上,LSTM模型在均方根誤差(RMSE=1.495) 上表現(xiàn)最佳,展現(xiàn)了其對復雜非線性模式的強大捕捉能力,但模型訓練與調參成本較高。ARIMA模型(RMSE=1.503) 的預測精度緊隨其后,且模型構建相對高效,展現(xiàn)了統(tǒng)計學模型的穩(wěn)健性。Prophet模型雖然易于實現(xiàn),但在本次預測任務中表現(xiàn)最差。研究結論為不同業(yè)務場景下的物料需求預測提供了模型選擇依據(jù)。
關鍵詞:物料需求量;ARIMA模型;Prophet模型;LSTM模型;預測性能;時間序列預測;比較研究
中圖分類號:TP311" " " 文獻標識碼:A
文章編號:1009-3044(2025)28-0084-04
開放科學(資源服務) 標識碼(OSID)
0 引言
企業(yè)的主要目標是通過調整缺貨量和庫存量來降低庫存成本,以使企業(yè)利潤最大化。為實現(xiàn)這一目標,持續(xù)更新和預測銷售量[1],調整庫存量和生產(chǎn)量對企業(yè)至關重要。另一方面,動態(tài)規(guī)劃物料生產(chǎn)可以通過釋放人力資源來顯著提升生產(chǎn)力,從而將其分配到更具創(chuàng)造性和非重復性的任務中。這還能提高員工士氣和投入度,加快目標實現(xiàn)速度,并通過最小化人為錯誤提高準確性。
因此,本文旨在系統(tǒng)性地比較三種代表性時序預測模型[2]——經(jīng)典的統(tǒng)計模型ARIMA、Facebook開源的Prophet模型[3]以及深度學習模型LSTM[4]——在真實物料需求預測任務中的表現(xiàn)。通過實證分析,本文將評估各模型的預測精度與應用成本,以期為企業(yè)在不同場景下選擇合適的預測工具提供科學依據(jù)。
1 數(shù)據(jù)獲取與預處理
本文所使用的數(shù)據(jù)來源于2022年高教社杯全國大學生數(shù)學建模競賽(https://www.mcm.edu.cn/html_cn/node/388239ded4b057d37b7b8e51e33fe903.html) ,選取2019年1月—2022年5月共2 000余種物料以周為單位的需求量時間序列數(shù)據(jù),并從中篩選出6種重點關注物料,利用歷史數(shù)據(jù)對預測模型進行評價對比。
基于Python 3.6版本的Jupyter Notebook環(huán)境設計程序,對附件中的歷史數(shù)據(jù)進行分析,根據(jù)數(shù)據(jù)中的物料編碼列,統(tǒng)計出共計284種物料在各時間點上需求出現(xiàn)的頻數(shù),并根據(jù)結果選擇了6種重點關注物料,如表1所示。
2 研究方法
2.1 ARIMA模型
ARIMA(Autoregressive Integrated Moving Average) 模型[5]是一種經(jīng)典的時間序列預測方法,由Box和Jenkins在20世紀70年代提出。ARIMA(p,d,q)建模框架通過協(xié)同運作自回歸過程(AR,階次p) 、差分變換(I,階次d) 和移動平均過程(MA,階次q) 3個關鍵機制,有效解決了非平穩(wěn)時間序列的預測難題。其核心優(yōu)勢在于將序列平穩(wěn)化處理(I) 與動態(tài)模式捕捉(AR/MA) 有機結合。ARIMA(p,d,q)的一般形式為:
[(1-?iBi)(1-B)dXt=c+(1+θiBi)εt]" "(1)
式中:[?i]為自回歸系數(shù),[εt]為白噪聲,[θi]為移動平均系數(shù),B為后移算子。
在ARIMA建模前,需要對時間序列數(shù)據(jù)進行平穩(wěn)性檢驗,此處使用kpss()函數(shù)進行KPSS檢驗[6],原假設H?為所檢驗的序列是平穩(wěn)的。具體結果如表2所示。
從輸出的檢驗結果對比表可以看出,序列X?的檢驗p值小于0.05,拒絕數(shù)據(jù)序列平穩(wěn)的原假設,認為該列數(shù)據(jù)是非平穩(wěn)序列。一階差分后的檢驗p值為0.1,大于0.05,則接受原假設,即序列X?一階差分后為平穩(wěn)數(shù)據(jù),使用KPSS檢驗對序列X?的參數(shù)d取值進行預測,d=1。ARIMA(p,d,q)模型中的參數(shù)p和q的定階過程可以通過網(wǎng)格搜索算法計算所有可能模型的AIC(Akaike Information Criterion,赤池信息準則) ,根據(jù)計算出的AIC值最小的模型作為識別依據(jù),確定最佳模型,其結果如圖1所示。
從圖1可以看出,AIC數(shù)值最小時ARIMA最佳模型為ARIMA(2,1,2)。對模型殘差進行檢驗,其模型預測殘差分析圖見圖2。
據(jù)Q-Q圖可以看出,殘差檢驗圖基本符合正態(tài)分布,且相互獨立,為白噪聲序列,模型擬合有效。說明模型ARIMA(2,1,2)參數(shù)選擇合理。
2.2 Prophet模型
Prophet[6]為Facebook Inc.提供的支持Python和R的開源工具。基礎模型將時間序列分解為3個部分:增長(或趨勢) g(t)、季節(jié)性趨勢s(t)和節(jié)假日h(t),因此時間序列可以分解為:
[y(t)=g(t)+s(t)+h(t)+εt]" " " " (2)
式中:[εt]表示模型未考慮的變異,假設其服從正態(tài)分布。Prophet模型可視為加法模式。在此框架下,預測被表述為曲線擬合任務,時間作為唯一回歸變量,因此模型是單變量的。本研究采用的趨勢函數(shù)為分段線性函數(shù),使用Laplace先驗進行稀疏約束。
2.3 LSTM模型
LSTM(長短期記憶網(wǎng)絡) [7]本質上是RNN[8]的改良架構,其核心價值在于通過門控單元設計,顯著緩解了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡在建模長距離時序依賴時面臨的梯度傳輸失效問題。它在時間序列預測、自然語言處理(NLP) [9]、語音識別等領域表現(xiàn)優(yōu)異。借助門控機制(包含輸入門、遺忘門、輸出門) 和持續(xù)更新的記憶單元(Cell State) ,LSTM網(wǎng)絡能夠建立跨越長時間步的依賴關系模型。其核心結構包括遺忘門、輸入門、記憶單元更新和輸出門,各部分參數(shù)包括激活函數(shù)、權重矩陣、隱藏狀態(tài)等,其結構圖見圖3。
式中:[ht]為當前時刻的隱藏狀態(tài)(輸出) 。針對重點物料需求量的預測,在神經(jīng)網(wǎng)絡模型方面只采用LSTM模型,并與ARIMA模型和Prophet模型進行性能比較。
3 仿真實驗
3.1 模型性能評估指標篩選
建立雙指標評估框架:采用MAE衡量預測偏差絕對值,利用RMSE評估誤差離散程度,以此系統(tǒng)檢驗LSTM和Prophet模型對重點關注物料需求量的預測能力,計算公式詳見式(3) 、式(4) 。
[MAE=1Ni=1Nei=1Ni=1Nyobservedi-ypredictedi]" " (3)
[RMSE=1Ni=1N(yobservedi-ypredictedi)]" " " " " "(4)
符號定義:
[ypredictedi]為三類模型(ARIMA、Prophet、LSTM) 的預測結果;i[?]Z+為預測時域中的日期序號。
3.2 三種模型擬合優(yōu)度檢驗
ARIMA模型使用Python statsmodels包執(zhí)行Box-Jenkins方法,通過網(wǎng)格搜索算法確定的ARIMA(p,d,q)最佳模型為ARIMA(2,1,2),選取數(shù)據(jù)集的前80%為訓練集,20%為測試集。擬合選取的關鍵材料需求數(shù)據(jù),該模型的RMSE值為1.503,擬合效果如圖4所示。
Prophet擬合通過fbprophet庫實現(xiàn)Prophet預測框架,參數(shù)化配置為:
model = Prophet(interval_width=0.95)
future = model.make_future_dataframe(periods=36, freq='MS')
對重點物料需求時序數(shù)據(jù)進行模型擬合,計算得均方根誤差RMSE=3.002(式(4)) ,樣本內(nèi)擬合效果見圖4。可視化結果表明,該模型對歷史數(shù)據(jù)的擬合軌跡與實際觀測值具有一定的吻合性,表明其具備一定的時序模式捕捉能力。
LSTM模型通過TensorFlow 2.x的Keras API實現(xiàn),關鍵參數(shù)如表3所示。
物料需求序列擬合后,預測集均方根誤差RMSE=1.495(式(4)) ,模型訓練的動態(tài)過程見圖4中的點線。
基于圖4的實證分析:訓練集擬合誤差低于閾值(目測MAE<0.8) ,測試集趨勢轉折點匹配度>85%,證實LSTM模型對物料需求時序的預測具有顯著可靠性。
以上三種模型在預測物料需求量數(shù)據(jù)時,各模型的性能指標MAE和RMSE見表4。
從表4可以看出,對于幾種重點關注物料,使用LSTM的神經(jīng)網(wǎng)絡實現(xiàn)了較為準確的預測,其MAE和RMSE分別為0.872和1.495,但其訓練和調參所需時間最長、計算成本最高。相比之下,Prophet的表現(xiàn)則不甚理想,但模型調參和數(shù)據(jù)準備相對較快。ARIMA在準確性和模型選擇與訓練所需時間方面均表現(xiàn)良好。
4 討論
LSTM和ARIMA在該任務中表現(xiàn)優(yōu)異,可能因為數(shù)據(jù)隱含的非線性特征與強趨勢性:LSTM通過長短期記憶網(wǎng)絡捕捉復雜時序依賴,而ARIMA的平穩(wěn)性假設與數(shù)據(jù)趨勢高度吻合。相反,Prophet對具有明確節(jié)假日效應、多周期疊加(如電商銷量數(shù)據(jù)) 或缺失值較少的數(shù)據(jù)更有效,其內(nèi)置的季節(jié)性分解與異常點處理機制在結構化時間特征中優(yōu)勢顯著。若數(shù)據(jù)強非線性且計算資源充足,LSTM是優(yōu)選;須平衡解釋性與效率時,ARIMA更普適;Prophet則適合處理含業(yè)務規(guī)則(如促銷周期) 的標準化數(shù)據(jù)集。
5 結束語
對小批量物料生產(chǎn)數(shù)據(jù)的準確預測能夠為微型電商企業(yè)物料生產(chǎn)及成本控制提供一定的科學理論指導。為構建物料生產(chǎn)需求預測的理論方法體系,本研究實證檢驗了ARIMA、Prophet與LSTM三種時序模型的適用性。實驗結果表明,ARIMA模型在平均絕對誤差(MAE) 上表現(xiàn)最佳(0.783) ,展現(xiàn)了優(yōu)良的預測性能(RMSE=1.503) 。預測效能方面ARIMA>LSTM>Prophet,由此可見,經(jīng)典統(tǒng)計模型在工業(yè)需求預測中仍保持競爭優(yōu)勢。由于本研究僅基于特定數(shù)據(jù)集和物料種類,未考慮外部變量(如促銷、節(jié)假日) 對需求的影響,故結論的普適性有待進一步檢驗。
參考文獻:
[1] MENCULINI L,MARINI A,PROIETTI M,et al.Comparing prophet and deep learning to ARIMA in forecasting wholesale food prices[J].Forecasting,2021,3(3):644-662.
[2] 閆祥祥.使用ARIMA模型預測公園綠地面積[J].計算機科學,2020,47(S2):531-534,556.
[3] 蔡遠航,馮建新,王艷青,等.基于NeuralProphet-LSTM模型的碳價預測研究[J].全球能源互聯(lián)網(wǎng),2025,8(2):239-249.
[4] 侯川川,王歡,關偉,等.基于時序長短期記憶模型的道路路面性能預測[J].浙江大學學報A輯(應用物理與工程)(英文版),2025,26(5):424-438.
[5] 余璽輝,陳堅,喬志坤,等.基于ARIMA模型對集采藥品環(huán)孢素口服制劑的科學報量[J].中國現(xiàn)代應用藥學,2025,42(7):1195-1199.
[6] 孫玉林,余本國.Python機器學習算法與實戰(zhàn)[M].北京:電子工業(yè)出版社,2021.
[7] 陳永平,王瑾琪,徐曉武,等.基于LSTM模型的風暴增水預報研究[J/OL].河海大學學報(自然科學版),2025:1-16.[2025-06-08]. https://kns.cnki.net/kcms/detail/32.1117.tv.20250527. 1652.012.html.
[8] 田延飛,李知臨,艾萬政,等.基于LSTM-RNN的船舶操縱運動黑箱建模[J].艦船科學技術,2024,46(11):80-84.
[9] 許德龍,林民,王玉榮,等.基于大語言模型的NLP數(shù)據(jù)增強方法綜述[J].計算機科學與探索,2025,19(6):1395-1413.
【通聯(lián)編輯:謝媛媛】