摘 要:隨著手機端購物平臺興起,消費者購物行為出現明顯改變。線上銷售迅速成為各行各業主要銷售渠道之一。傳統的預測方法主要以數據挖掘為主,雖然簡單易用,但是難以處理復雜的非線性時間序列,因此該文提出一種基于LSTM-DNN的預測模型,在同LSTM與RNN進行比較后,新模型具有明顯優勢,可有效提高預測精度,對電商企業降低管理成本具有重要意義。
關鍵詞:深度學習;電商銷售;時間序列;購物平臺;預測模型
中圖分類號:F713.36 文獻標志碼:A 文章編號:2095-2945(2024)23-0040-05
Abstract: With the rise of mobile shopping platform, consumer shopping behavior has changed significantly. Online sales have quickly become one of the main sales channels in various industries. The traditional prediction method is mainly based on data mining, which is simple and easy to use, but it is difficult to deal with complex nonlinear time series, so this paper proposes a prediction model based on LSTM-DNN. Compared with LSTM and RNN, the new model has obvious advantages, effectively improves the prediction accuracy, and is of great significance for e-commerce enterprises to reduce management costs.
Keywords: deep learning; e-commerce sales; time series; shopping platform; prediction model
電商銷售市場在經濟增長中具有革命性作用。電商銷售市場快速崛起,帶動著國民經濟飛速發展,給創造就業機會、提高市場活力、促進創新發展帶來了巨大潛力。但當用戶需求遠小于產能增長時,將會出現產能過剩,從而導致電商市場萎靡,甚至給整體金融市場造成巨大損失。自2009年,每年“雙十一”購物節后,由于消費者對優惠商品的需求通常集中在有限的時間內,電商平臺為了滿足需求,通常提前增加產能,包括增加倉儲和物流設施,加大供應鏈規模等[1]。但當客戶需求降低后,許多商家便面臨庫存積壓、盈利下降等問題。因此,客戶銷量直接影響電商經濟發展,同時電商市場良好發展對國民經濟具有重大影響,所以對銷量做出合理預測,為商家提供參考標準,有利于促進市場的良性循環。
近些年來,關于電商銷售預測,主要分為傳統統計法、數據挖掘法與機器學習法3個方向。在傳統統計方面主要利用自回歸綜合移動平均(ARIMA)、霍爾特-溫特(HoltWinters)等方法,通過對歷史銷售數據進行時間序列分析,捕捉銷售數據的季節性與趨勢,從而進行預測[2]。雖然傳統統計方法簡單易用,但在處理復雜非線性關系時效果不佳。在數據挖掘方面,主要利用關聯規則挖掘和聚類分析等方法。通過挖掘商品之間的關聯性和潛在的交叉銷售機會,或者將銷售數據分組幫助企業了解市場細分的特點,從而優化商品組合與制定相應價格。在機器學習方面,主要利用隨機森林、梯度提升樹等集成學習方法處理數據,但是隨著算力的提升,機器學習的分支深度學習中的循環神經網絡(RNN)與長短期記憶網絡(LSTM)在預測方面也展示出良好效果[3]。準確預測電商銷售價格,是推動電商行業進步的關鍵,該研究有助于政府部門把控并及時調整電商行業發展,避免因價格而導致產能過剩,從而引發經濟問題。
1 研究方法
本章首先對電商銷售預測的2種基于傳統方法與深度學習的預測模式進行介紹,之后對研究使用的長短期記憶網絡(LSTM)與深度神經網絡(DNN)作出詳細介紹。
1.1 電商銷售預測
1.1.1 基于傳統方法的預測模式
傳統的電商銷售預測方法主要包括時間序列分析、回歸分析、趨勢分析。時間序列分析利用歷史銷售數據中的時間模式,如移動平均法和指數平滑法,來預測未來趨勢;回歸分析則建立數學模型,考慮多個自變量,如廣告投入、季節性變化,以描述銷售量與影響因素之間的關系;趨勢分析旨在識別長期趨勢,通過圖表和統計工具分析銷售數據的發展方向。盡管這些傳統方法對于預測提供了基礎,但在處理非線性關系和突發事件方面還存在明顯局限性[4]。
1.1.2 基于深度學習的預測模式
深度學習方法在電商銷售預測中展現了強大的潛力,其中循環神經網絡(RNN)、卷積神經網絡(CNN)、長短期記憶網絡(LSTM)、注意力機制和深度神經網絡集成等技術成為關鍵工具。RNN能有效處理時間序列數據的時間依賴性,CNN可捕捉局部特征,LSTM處理長期依賴關系,而注意力機制和深度神經網絡集成提高了模型對復雜模式的理解和預測準確性[3]。盡管深度學習方法需要更多的數據和計算資源,并對超參數調整敏感,但在處理大規模數據和復雜關系方面相較傳統方法更具優勢。
1.2 LSTM
長短期記憶網絡(LSTM)是一種特殊的循環神經網絡(Recurrent Neural Network,RNN),旨在解決傳統RNN面臨的梯度消失和梯度爆炸問題。LSTM通過引入門控機制,能夠有效地捕捉和記憶長期依賴關系,使其在處理序列數據時表現更為出色。LSTM模型的核心結構是記憶元(memory cell),用于存儲長期依賴關系,其由3個門控機制組成:輸入門(Input gate),控制當前輸入信息對記憶元的影響程度;遺忘門(Forget gate),控制之前記憶信息遺忘的程度;輸出門(Output gate),控制記憶元信息輸出的程度。其各自數學表達式如下
式中:σ為sigmoid函數;W為權重矩陣;b為偏置向量;ft為遺忘門輸出;it為輸入門輸出;ct為記憶元輸出;ot為輸出門輸出;ht為當前時刻的隱狀態;xt為當前時刻的輸入。LSTM工作過程如圖1所示。
1.3 DNN
深度神經網絡(DNN)是一種人工神經網絡,由多個層的神經元組成,每層之間相互連接,其結構如圖2所示。
圖2中輸入層主要接受輸入數據,隱藏層對輸入數據進行非線性變換,提取特征,最后再由輸出層將預測結果輸出。DNN可以包含一個或多個隱藏層。隱藏層的數量和每個隱藏層的神經元數量決定了DNN的復雜度。如圖2所示,DNN在得到數據后,經過輸入層進入網絡,再由隱藏層進行非線性變換,從而提取特征,最后由輸出層將結果輸出。
2 研究設計
本章將對研究設計作出詳細介紹,其中包括電商銷售預測所使用的模型框架與預測算法LSTM-DNN的算法流程介紹。
2.1 預測模型框架
本文主要利用LSTM與DNN構建神經網絡對電商銷售數據進行預測。為此,將深度學習應用于電商銷售預測,總體研究流程如圖3所示,研究流程主要分為以下2個部分:數據處理與模型構建。
第一部分:數據處理。對原始數據進行缺失值與異常值處理,并進行特征提取。
第二部分:模型構建。對處理后的數據使用LSTM-DNN進行預測,并得到最后結果。
2.2 預測算法LSTM-DNN
在電商銷售預測的研究中,其關鍵是對長時間的非線性時間序列進行擬合,因此本研究提出了一種基于LSTM-DNN的預測算法,算法主要由2部分組成:LSTM層和DNN層。該算法主要利用LSTM捕捉時間序列的長期依賴關系,并利用DNN進行非線性擬合,以提高預測精度。由于在電商銷售任務中,特征間具有較強的耦合性,因此需要將不同維度特征進行解耦訓練,將構造好的時間序列輸入到LSTM中,之后通過DNN達到輸入空間到輸出空間的映射,從而實現時間序列預測的目的。具體實現步驟如圖4所示。
經過圖4的算法流程對LSTM-DNN模型進行訓練后,可將實時數據輸入模型中,則可得到對未來銷售額的預測。
3 實驗與結果分析
基于上述過程,本章將對實驗過程及結果進行描述與分析。首先,將對數據來源與預處理做出介紹,然后將對研究所提出的模型進行構建與訓練,并對訓練的模型進行評估,最后分析結果,并與其他算法進行比較。
3.1 數據集介紹及預處理
3.1.1 數據集介紹
本文采用的數據集為廣州抖音直播電商銷售的真實數據,抖音直播帶貨是一種通過抖音平臺實時視頻直播的商業模式,由知名主播或網紅通過吸引觀眾的注意力,展示和介紹各種商品,實時與觀眾互動,推動商品銷售的過程。觀眾可以通過彈幕互動,獲得專屬優惠,并在直播中完成購物。這種形式的直播通過豐富的商品介紹、實時促銷、用戶互動,為消費者提供了一種富有趣味性和參與感的購物體驗,同時也成為品牌推廣和銷售的創新途徑,推動了電商行業的快速發展。
該數據主要包含2023年1月20日至2023年7月20日之間發生的交易。主要涉及中國31個省份,共52 172筆交易,152種不同商品。其中,主要包含16個特征,分別是購買數量、商品單價、實際支付、商品運費、優惠總額、交易時間、平臺優惠、商家優惠、支付優惠、紅包抵扣、支付方式、發貨地區、購買渠道、廣告渠道、流量來源和帶貨達人。其詳細情況見表1。
3.1.2 數據預處理
此數據集經過脫敏處理,和實際電商銷售成交量、成交金額等存在一定差異,但是對整體數據特性沒有影響。但數據依然存在一定缺失,因此對數據進行預處理,以匹配模型需求。
部分商品由于在數據收集過程中,受到預售或優惠等因素影響,在一定時間內,只存在用戶行為而沒有銷售信息的情況。此外,由于后臺日志缺失等原因同樣會導致銷售信息出現缺失。由于以上情況,導致數據出現缺失,對模型訓練的完整性產生極大影響。因此,在本研究中,采用三次樣條插值法對缺失數據進行插值補全。采用該算法有以下3點理由:①現實性。線性插值與近鄰插值等簡單插值法,雖然減少了計算量,但是難以擬合現實數據。②平滑性。三次樣條插值法能夠提供平滑的曲線,因為其在一定范圍內使用低次多項式進行擬合。③連續性。三次樣條插值法要求插值曲線在每個數據點處具有一定的導數連續性。
三次樣條插值法是一種插值技術,通過將數據點分段連接成多個三次多項式,確保插值曲線在各數據點處連續且光滑,具有一階和二階導數的連續性。通過滿足插值條件和平滑性條件,構建方程組并求解,最終得到一條光滑的曲線,廣泛應用于科學計算和工程領域,提供有效的數據擬合和插值解決方案。
3.2 模型訓練
在訓練時,將數據集中152種商品交易的前4個月時間,即2023年1月20日至2023年5月20日的交易情況作為訓練集進行訓練。
經過實驗,最后將LSTM層數確定為12層,同時為了防止過擬合,將在每層加入0.3的隨機失活(dropout)層。同時在訓練過程中,選擇均方誤差(MSE)作為損失函數,其計算公式如下所示
在訓練過程中,優化器采用Adam函數,Adam函數屬于梯度下降算法的一種,其在隨機梯度下降(SGD)的基礎上引入了一階動量、二階動量與修正項,將修正后的一階動量與二階動量帶入參數并更新公式,通過以上操作模型收斂更為穩定,且自適應效果更佳。
接下來是對DNN網絡的訓練,經過多次參數調試,確定最佳的參數結構,其中最后將DNN層數設置為4層,神經元個數分別設置為15,4,15,激活函數分別為“relu”“sigmoid”“relu”“relu”。2種激活函數計算公式如下所示
DNN在優化過程中同樣使用Adam優化器與MSE作為損失函數。
3.3 評價指標
當模型訓練完善后,分別將152種商品2023年5月20日至2023年7月20日的交易數據作為測試集,進行模型評價。
在模型評價方面,本文采用均方根誤差(RMSE)和平均相對精度(R2)2個性能指標來評估模型的性能。其中,均方根誤差(RMSE)值越小,表示模型效果越佳,而R2值越接近1,表示模型效果越佳。2種評價模型定義為
3.4 結果與分析
在經過多輪訓練與測試后,在152種商品中,將2個指標結果取平均數,并分別對LSTM、RNN、LSTM-DNN在訓練100輪、500輪、1 000輪的情況下進行比較,其結果見表2。
通過與LSTM和RNN進行多輪訓練與比較后,可知隨著訓練次數的增多LSTM-DNN的精度優于其余2個算法,并且通過結果發現,在經過1 000輪訓練后LSTM與RNN的效果近似,進一步證明模型優化的關鍵性,并且對比100輪到500輪與500輪到1 000輪之間可以發現,損失值逐漸變小,說明模型開始逐漸擬合。
4 結束語
LSTM-DNN模型的優勢在于其對序列數據的高效處理能力,從而能夠更好地捕捉銷售數據中的時序關系和潛在模式。通過對歷史銷售數據的學習,模型不僅能夠準確預測未來銷售趨勢,還能夠識別出潛在的市場變化和消費者行為演變。然而,深度學習模型仍有很多局限,其性能受到數據質量、特征選擇等多方面因素的影響。在未來的研究和實踐中,需要不斷優化模型,結合更多領域專業知識,使其更加適應不同業務場景的需求。
參考文獻:
[1] 張夏恒.跨境電商類型與運作模式[J].中國流通經濟,2017,31(1):76-83.
[2] 劉麗佳,李曉雪,王海濱,等.考慮節假日的ARIMA模型在酸奶銷量預測中的應用[J].計算機科學與應用,2023,13(12):2172-2179.
[3] 柯苗,黃華國.基于LSTM神經網絡的電商商品銷售預測方法[J].福建師大福清分校學報,2020(5):83-89.
[4] 姜曉紅,曹慧敏.基于ARIMA模型的電商銷售預測及R語言實現[J].物流科技,2019,42(4):52-56,69.
基金項目:廣東大學生科技創新培育專項資金資助項目(pdjh2022b0642)
第一作者簡介:王澤菡(2001-),男。研究方向為深度學習、數據分析。
*通信作者:徐毓暉(1985-),女。研究方向為電商銷售、人工智能。