李釗慧 張康林



摘 要:汽車銷售過程中存在新車與二手車銷售不平均、放款受季節影響等問題。而人工神經網絡適用于處理不規則、非線性的汽車銷量數據,基于BP算法和LSTM算法建立15日的汽車銷售預測模型,比較二者的預測效果,可以幫助銷售商處理放款量及放款金額的不確定性問題。結果顯示,LSTM模型對于受季節因素影響的汽車銷售數據在銷售臺數和銷售金額趨勢預測方面更為有效合理,在模型預測的精度上比BP模型效果更優,可為汽車行業的銷售預測提供參考。
關鍵詞:人工神經網絡;銷售預測;BP算法;LSTM算法
中圖分類號:F724.7 ? ? ?文獻標志碼:A ? ? ?文章編號:1673-291X(2020)20-0084-05
引言
隨著我國人們生活水平的提高,我國汽車銷售市場重心開始下沉,汽車行業痛點顯現。在此競爭局面下,以經銷商的銷售能力為中心解決強壓庫存的難題,以節約汽車相關企業的經營成本和經營風險為目標顯得尤為重要。通過建立汽車銷售預測模型,合理規劃產能安排放款金額,免掉不必要的多余費用,是降低經營成本的重要舉措。
BP算法是人工神經網絡中重要的一個算法,在解決非線性系統問題時優勢明顯,不少學者通過進行持續改進[1-3],在預測股價、電力、鋼鐵等方面應用價值突出[4-6]。楊婷、楊根科、潘常春[7](2009)利用BP神經網絡定性分析每個因素的權重,建立了汽車故障率預測模型。羅戎蕾、劉紹華、蘇晨[8](2014)將對服裝銷售影響因子分為季節、節假日和品類因素,建立3層BP神經網絡學習銷售預測網絡模型。王錦、趙德群[9](2018)將BP神經網絡與遺傳算法相結合,發現可以更好地預測北京市某大型超市的大米日銷量。而LSTM算法是循環神經網絡的一種變體,在深度學習后能更好地處理序列化數據,其在電力負荷、流量等預測具有良好的預測效果[10-13]。李鵬、何帥等[14](2018)使用自適應矩估計算法進行深度學習發現LSTM算法在預測中精度較高。李珍珍、吳群[15](2019)在Pytorch框架下搭建LSTM模型對上證、深證指數和國內特定4支股票的最高價進行預測,發現在短時間內股票預測結果與真實值接近程度高,長時間則出現相差較大的問題。宋剛、張云峰、包芳勛和秦超[16](2019)通過自適應學習策略的PSO優化算法對LSTM模型的關鍵參數進行尋優,提高股票價格預測精度。因此,本文選擇使用BP神經網絡和LSTM神經網絡解決汽車銷售相關的預測問題。
一、BP算法和LSTM算法原理
(一)BP算法簡介
BP(Back Propagation)神經網絡由Rumelhart和McClelland等科學家[17](1986)提出,用梯度下降法的基本理念和梯度搜索技術,目標是求得網絡的實際輸出值和期望輸出值的誤差均方差為最小。BP神經網絡由輸入層、隱藏層和輸出層三部分組成,結構示意如圖1所示。
圖1中,Xi表示來自第i個神經元的輸入,Wh表示從輸入層到隱藏層第i個神經元的連接權重,ho表示偏置項,f(x)表示激活函數,O表示模型計算輸出值,y表示最終輸出值。本文選取的是Sigmoid+Adaline模型。
在上述模型的基礎上,又細分為4組。
由其特性,本文將收集到的汽車銷售數據分為15天為一周期,將對象分為二手車、新車,使得BP算法在應用于解決本文中汽車銷售放款問題時可以一定程度上避免陷入局部極小值。
(二)LSTM算法簡介
LSTM(Long Short Term Mermory network)神經網絡在1997年由Sepp Hochreiter[19]等人提出,主要改良了循環神經網絡在處理距離較遠的序列時的梯度消失問題。LSTM實現了3個門計算,即遺忘門、輸入門和輸出門。?滓表示sigmoid激活函數,wf表示遺忘門的權重矩陣,wi表示輸入門的權重矩陣,w′c表示更新門的權重矩陣,wo表示輸出門的權重矩陣,bf表示遺忘門的偏置,bi表示輸入門的偏置,b′c表示更新門的偏置,bo表示輸出門的偏置,ht表示t時刻的輸出,C′t表示t時刻更新的細胞狀態。
二、某公司汽車銷售預測分析
(一)處理數據
1.日期整理
本文收集并整理了某公司汽車銷售數據,并非傳統連續型數據,時間范圍為2017年9月30日至2019年2月20日,共510個離散數據,補全缺失的數據。
2.數據分類
按照汽車類別分為兩類:①新車;②二手車。按照汽車銷售屬性分為兩類:①銷售臺數;②銷售金額。做預測時分別預測臺數和金額,給公司的庫存系統和業務員的業績重點提供參考。為了避免陷入局部極小值和梯度消失等問題,將510天的數據每隔15天為一周期進行合計,缺失值以0為記錄,構建完整有效的數據集,預處理后得到:①15天新車臺數;②15天新車銷售金額;③15天二手車臺數;④15天二手車銷售金額。
(二)BP算法和LSTM算法參數設計
本文的硬件環境和軟件環境,具體如表1所示。
根據對數據的預處理分析,BP和LSTM訓練模型的參數設置總結如表2所示。
本文選取均方誤差(MSE)以及決定系數(R2)作為兩個模型預測精準度的評價指標[21,22],其中,均方誤差是指參數估計值與參數真值之差平方的期望值,計算公式如(1);決定系數也稱擬合優度,計算公式如(2)。
(三)預測結果對比分析
某公司2017年9月30日至2019年2月20日的日銷售數據共計510條,分別對15天新車臺數、15天新車銷售金額、15天二手車臺數和15天二手車銷售金額共4類需要進行預測的數據進行預測。左圖為BP模型的預測結果,右圖為LSTM模型的預測結果,藍色表示真實數據,紅色表示預測數據。預測結果如下。