向俊坤 郁佳幸 高賀 孫浩翔



摘 要:本文針對電商需求預測問題,基于促銷節(jié)日因素S(Sale)和倉庫因素C(Category),借助Matlab、Excel軟件進行數(shù)據(jù)預處理,以ARIMA時間序列模型為核心,建立SWECPX(Sale Ware Effect Category Product X)模型,使用Matlab軟件中的X-12-ARIMA選項等方法進行求解,實現(xiàn)了對商品需求量的準確預測,取得較好的1-wrmape指標測試效果。本文最大的創(chuàng)新點是提出了SWECPX模型,對影響商品需求量的要素S和C進行區(qū)分和求解,使對商品需求量預測更加精確,1-wrmape值較高。當每日的商品需求量處于較低水平時,預測效果的提升尤為顯著,其預測值幾乎與實際值相同。因此,我們期望SWECPX模型可以為電商倉儲平臺的決策提供切實的參考和借鑒。
關鍵詞:ARIMA模型;SWECPX模型;時間序列;電商需求預測;電商平臺
本文索引:向俊坤,郁佳幸,高賀,等.<變量 2>[J].中國商論,2024(08):-032.
中圖分類號:F742 文獻標識碼:A 文章編號:2096-0298(2024)04(b)--04
1 問題介紹
為了便于商品貨物的統(tǒng)一調度,電商平臺會提供配套倉庫供電商儲存貨物。當今物聯(lián)網(wǎng)技術發(fā)達,物流與數(shù)學理論、計算機技術結合緊密,通過大數(shù)據(jù)預測可以降低庫存成本,并且為商家提供足夠的存儲能力。供應鏈優(yōu)化問題的重點一般包含兩個方面:需求預測和庫存優(yōu)化。本文數(shù)學建模主要解決需求預測問題。
在平常時期內,商店需求量維持在一個較低的、平穩(wěn)的水平;在大賣時期內,商店的需求量會經(jīng)歷從較低的、平穩(wěn)的水平突然上升到一個較高水平。商店的需求量不斷經(jīng)歷從平常時期轉進為大賣時期,又從大賣時期轉進為平常時期,可以概括為商店的需求量具有在短期突變和長期趨變特性,不斷經(jīng)歷從平穩(wěn)的、較低的水平與較高的水平之間的相互轉變。
根據(jù)互聯(lián)網(wǎng)消費使用習慣和不同倉庫的出貨趨勢,認為由平常時期進入大賣時期的主要原因在于倉庫因素(C)和電商平臺促銷因素(S)。
2 模型假設
(1)假設沒有倉庫、網(wǎng)店倒閉,沒有商品停產(chǎn)。
(2)僅考慮問題中的倉庫、商品種類、商家因素,不考慮次要因素的影響。
3 模型框架
為了求解問題,本文建立SWECPX(Sale Ware Effect Category Product X)模型,其中S表示商家促銷節(jié)日,W表示商品種類,E表示促銷成效,C表示倉庫,P表示商品,X表示對于新的影響維度該模型同樣適用。
經(jīng)過研究發(fā)現(xiàn),商品P需求量走勢主要受商品種類W與倉庫C兩者的影響,而直接影響不同商品種類需求量變化的原因是各大電商舉辦的促銷節(jié)日S。電商針對特定種類商品的促銷節(jié)日和對全部商品通用的促銷節(jié)日S,促使各類商品P在不同時間進入大賣期。
本文通過SWCPX三級模型,結合ARIMA模型,可以使大賣時期的預測結果更加準確。
4 實驗設置
ARIMA模型,屬于時間序列分析中的一種[1]。ARIMA模型的優(yōu)勢在于可以處理非平穩(wěn)的時間序列,商品的儲存數(shù)量在時間序列上是非平穩(wěn)的,其均值、方差隨時間發(fā)生變化。ARIMA模型通過對數(shù)據(jù)進行差分處理,可以將非平穩(wěn)時間序列轉換為平穩(wěn)時間序列,從而使模型可以對其進行有效建模。
式(1)中,p和q是模型的自回歸階數(shù)和移動平均階數(shù);φ和θ是不為零的待定系數(shù);εt獨立的誤差項。
本文的實驗主要在數(shù)學軟件Matlab上進行,以ARIMA時間序列模型為核心,使用Matlab軟件中的X-12-ARIMA選項[2]等方法對數(shù)據(jù)集進行求解與分析。在實驗結果分析部分逐步給出最終的SWECPX模型。
5 實驗結果分析
5.1 商品種類-商品模型(WP)的建立與分析(以服裝商品為例)
5.1.1 時間序列上服裝商品需求量平穩(wěn)性的ADF檢驗[3]
本文通過Matlab對數(shù)據(jù)進行ADF檢驗(adftest),來對時間序列的平穩(wěn)性做進一步判斷。
經(jīng)過ADF檢驗得出的函數(shù)返回值:
h=1,pValue=0.045,stat=-1.989,cValue=-1.9424
由于pValue接近0.05,并且stat與cValue相差較小,說明原假設被拒絕的概率較高,所以序列不平穩(wěn)。
5.1.2 差分法對服裝商品需求量的平穩(wěn)化處理
由于相關數(shù)據(jù)具有長期趨變和短期突變性,且時間序列的趨勢呈現(xiàn)非線性趨勢,所以是一個變形時間序列,需要對序列進行平穩(wěn)化處理。
使用差分法對相關數(shù)據(jù)進行平穩(wěn)化處理。差分法公式:
式(2)中t代表時間,y代表隨時間t變化的因變量,即商品的需求量。式(2)的含義是經(jīng)過一次差分處理后的商品需求量折線圖。
通過Matlab對數(shù)據(jù)進行ADF檢驗,得到數(shù)據(jù):
h=1,pValue=0.001,stat=-10.1951,cValue=-1.9425
從函數(shù)返回值判斷,數(shù)據(jù)平穩(wěn),與根據(jù)折線圖得出判斷相同,此時時間序列平穩(wěn)。
5.1.3 模型定階
通過對序列的自相關圖和偏自相關圖進行判別,可以對模型定階,進而確定模型階數(shù)的d、p、q。由于模型進行了1次差分,所以d=1。
拖尾是指偏自相關函數(shù)PACF按指數(shù)衰減或成正弦波形式,不能在某一步之后為零。截尾是指自相關函數(shù)ACF在一定階數(shù)之后應為零,稱其具有截尾性。
文章對差分后的數(shù)據(jù),進行自適應性ACF和偏自相關性PACF分析[4]可得,自相關系數(shù)和偏自相關系數(shù)都拖尾,在1階位置就開始基本落在2倍標準差范圍,所以p=1,q=1,是ARMA(1,1)模型。
綜合以上分析,確定應用d=1,p=1,q=1的ARIMA (1,1,1)模型。
5.1.4 對服裝商品需求量趨勢預測并檢驗
將服裝商品總供應天數(shù)的前90%共151天劃分為訓練集,用訓練集的數(shù)據(jù)投喂算法,對后10%共15天進行預測,然后對比預測結果和預測集實際值的差別,驗證預測效果。
使用ARIMA(1,1,1)模型對服裝商品總供應天數(shù)的訓練集,共151天進行預測,用訓練集的數(shù)據(jù)投喂算法,對后10%共15天進行預測。
本文用1-wrmape評價預測結果[5],然后對比預測結果和預測集實際值的差別,驗證預測效果。
式(3)中表示用訓練集預測第i天需求量值,yi表示測試集第i天的實際需求量,wrmape越大,表示預測值與測試集中的數(shù)據(jù)差距越大,模型預測效果越差。1-wrmape越小,模型測試效果越差,1-wrmape越大,模型測試效果越好。
對服裝商品的訓練集預測結果進行1-wrmape評價,得到結果:wrmape=0.2089,1-wrmape=0.7911,接近0.8,模擬效果較好。
5.1.5 product-1426型商品與服裝商品特性對比
為驗證服裝需求量作為整體,其特點是否具有一般性,從所有服裝產(chǎn)品中選取一類產(chǎn)品進行趨勢分析和預測,評價服裝需求量的趨勢是否對服裝類產(chǎn)品具有適用性。本文選取product_1426,即1426型產(chǎn)品,對其需求量變化趨勢與服裝需求量變化趨勢繪制堆疊折線圖進行對比,對比結果如圖1所示。
圖1 product-1426型商品與服裝商品特性折線對比堆疊圖
兩條折線趨勢基本相同,1426型商品與服裝整體需求量的大賣時期和平常時期吻合,說明服裝商品特性模型對單種服裝產(chǎn)品具有一般性。所以可以初步判定,對服裝商品需求量的預測可以用于對某一件服裝商品的需求量進行預測。
5.1.6 對product-1426型商品訓練集預測與評價
本文對product-1426型商品的訓練集預測結果進行1-wrmape評價,得到結果:wmape=0.2665,1-wrmape=0.7335,模擬效果較好,但比服裝商品總體需求的1-wrmape值0.7911小,是因為product-1426型商品總數(shù)據(jù)數(shù)量較小,訓練集數(shù)據(jù)也較小,訓練效果不如服裝類總商品以大量數(shù)據(jù)做支撐的預測效果。
從預測結果來看,同樣選取樣本的90%為訓練集頭尾數(shù)據(jù),對后10%也就是后15天進行預測,經(jīng)過1-wrmape評價,得到product-1426型商品的1-wrmape值為0.7335,服裝商品的1-wrmape值為0.7911,兩者預測效果較好,而product-1426型商品1-wrmape值較低的原因是測試集數(shù)據(jù)較少,所以預測效果不如服裝整體的預測效果是正常的、可接受的。
根據(jù)以上數(shù)據(jù),可以得出結論:商品種類在需求量趨勢上與該類商品具有相似性,基于ADF檢驗、圖檢驗、預測結果檢驗、邏輯驗證,可以ARIMA時間序列模型為基礎建立商品種類-商品模型。
5.2 促銷節(jié)日-商品種類模型(SW)的建立與分析
從2022年12月1日到2023年5月10日,服裝商品的需求量在總體上呈現(xiàn)上升趨勢,即服裝商品的長期趨變性是上升趨勢。
根據(jù)Matlab軟件已設定的X-12-ARIMA方法的自動選項,本文選擇5月1日五一大促促銷節(jié)日對服裝類型商品的影響因素進行判別并且得到促銷成效E服裝商品5.1=3.5。
將服裝商品2023年4月15日到2023年4月20日作為預測集進行預測,在不考慮促銷成效E時,預測效果:
Wmape=0.5882,1-Wmape=0.4118。
將服裝商品2023年4月15日到2023年4月20日作為預測集進行預測,在考慮促銷成效E時,加入新的代碼預測效果:
Wrmape=0.3042,1-wrmape值為0.6958。加入促銷成效E后。
對比真實值:
從圖像上,考慮促銷成效E的預測值更貼合實際折線圖;從1-wrmape評價上,考慮促銷成效E的1-wrmape值為0.8454,不考慮促銷成效E的1-wmape=0.4118。考慮促銷成效E使預測結果的1-wrmape值提高了105%。
5.3 倉庫-商品模型(CP)的建立與分析
與促銷成效E的計算方法相同,根據(jù)Matlab軟件已設定的X-12-ARIMA方法的自動選項,本文選擇對倉庫1的影響因素進行判別并且得到5月1日時間段內C1倉庫5.1=2。
將服裝商品2023年4月15日到2023年4月20日作為預測集進行預測,在考慮倉庫因素C時,預測效果:
當考慮Wmape=0.2574倉庫因素C時,1-Wmape=0.7426。不倉庫因素C時wmape=0.5882,1-wmape=0.4118。當考慮倉庫因素C時,1-Wmape評價值提高80.3%。
5.4 SWECP模型的數(shù)學表達
首先使用某商品的歷史數(shù)據(jù)對ARIMA模型算法進行投喂,通過ADF檢驗得出t時刻的預測值Xt。
式(4)中,p和q是模型的自回歸階數(shù)和移動平均階數(shù);φ和θ是不為零的待定系數(shù);εt獨立的誤差項。根據(jù)需要預測的時間段內的Xt形成一個從X1到Xt的時間序列,共t天。
由于E與C同時對商品的預測值產(chǎn)生影響,所以對E和C進行加權,并且需要判斷商品是否進入大賣時期。
式(6)中A表示最終預測值,用α作為促銷成效E的權重,用β作為倉庫影響系數(shù)C的權重,其中α+β=1,即αE與βC同時對商品的預測值產(chǎn)生影響。α=1或0.8,β=1或0.2。
Et表示在t時間段內促銷節(jié)日的促銷成效,比如E2.14表示2月14日左右情人節(jié)期間電商的促銷系數(shù)。Ct表示在t時間段內的倉庫影響系數(shù)。
pte是促銷節(jié)日判斷系數(shù),表示t時間段內商品是否受促銷節(jié)日S的影響,若t時期內存在S,則pte=1,反之pte=0;ptc是倉庫因素判斷系數(shù)表示t時間段內商品是否受倉庫C的影響,若t時期內存在C,則pte=1,反之pte=0。這里需要注意的是α和β也受pte和ptc的影響,因為若對于一件產(chǎn)品S和C只存在兩者中的一個影響因素,其權重就會變?yōu)?,而不存在影響因素的權重變?yōu)?。
綜上所述,SWECP模型的數(shù)學表達如下:
使用SWECP模型可以對各商家在各倉庫的商品2023年5月16日至2023年5月30日的需求量、考慮新出現(xiàn)的商家+倉庫+商品維度的需求量預測值、考慮6月規(guī)律性大型促銷的預測值或者其他情況的預測值進行求解。
6 結語
6.1 模型的優(yōu)點
(1)提出SWECPX(SaleWareEffectCategoryProductX)模型,對影響商品需求量的要素進行區(qū)分和求解。
(2)提出促銷節(jié)日-商品種類-商品三級影響模型,就促銷節(jié)日對產(chǎn)品需求量影響的內在規(guī)律做出歸納總結。
(3)提出促銷成效E,促銷節(jié)日對具體商品類型的促銷成效E進行計算并制成表格方便查詢。
(4)對于新的影響商品出貨量維度X具有適應性,只要通過X-12-ARIMA模型對X因素的歷史數(shù)值進行數(shù)據(jù)處理,就可以在考慮X因素的情況下精確預測數(shù)據(jù)。
(5)通過引入商品種類因素W和倉庫因素C的預測值與不引入兩因素的預測值對比,得出SWECPX模型預測更準確的結論。
6.2 模型的缺點
(1)對促銷成效E的計算不夠詳細,沒有對每一個導致商品進入大賣期的促銷節(jié)日都進行計算。
(2)對倉庫的出貨量特點研究不夠深入,沒有細致討論倉庫出貨量不同的特點和原因。
(3)數(shù)據(jù)預處理比較復雜。
6.3 模型的推廣
針對電商需求預測問題,本文建立了SWECPX三級模型,可對各商家在各倉庫的商品2023-05-16至2023-05-30的需求量、考慮新出現(xiàn)的商家+倉庫+商品維度的需求量預測值、考慮6月規(guī)律性大型促銷的預測值或者其他情況的預測值進行求解。該模型可以適用于任意新增加的X影響因素。本文的研究結果可以為電商倉儲平臺在價格促銷時的決策提供切實的參考和借鑒。
參考文獻
李玉翠,黃智銘,韋金玲.基于ARIMA模型的中越跨境電商發(fā)展趨勢分析[J].對外經(jīng)貿,2023(7):6-10.
中國人民銀行調查統(tǒng)計司.時間序列X-12-ARIMA季節(jié)調整:原理與方法[M].北京: 中國金融出版社,2006.
Paulus M P , Kadtke J B, Menkello F V .STATISTICAL MECHANICS OF BIOLOGICAL AND OTHER COMPLEX EXPERIMENTAL TIME SERIES: ASSESSING GEOMETRICAL AND DYNAMICAL PROPERTIES[J].International Journal of Bifurcation & Chaos, 1993, 3(3):717-727.
鄭永龍,單奕萌,胡晨.基于ARIMA模型的MOSFET壽命預測方法[P].中國,CN202211237652.8[2023-11-22].
劉文星.網(wǎng)絡攻擊頻率混沌時間序列預測[D].長沙: 國防科學技術大學,2009.