肖泉彬,黎小龍,車俊俊,何敏
(江西理工大學軟件工程學院,江西 南昌 330013)
中國零售市場進入了一個創新與技術應用的高發期[1],產品供應是市場上最重要的環節之一,準確預測商品銷售量從而把握供應量成為企業在市場競爭中存活的關鍵。隨著技術的進步,人工神經網絡預測技術在不同領域的應用不斷深入[2],相關學者應用神經網絡對臨床紅細胞用量[3]、血紅蛋白濃度[4]、鐵路大宗貨物運價風險[5]、羊肉價格[6]、滾動軸承故障預測[7]等各個領域進行預測,結果較好。該文在神經網絡的基礎之上通過Pearson相關性分析,對新零售行業銷售量的預測進行應用并得到驗證。
銷售數據預測的準確性取決于過去統計的銷售量數據的質量和數量,在數據的收集統計中存在異常情況,需要剔除不完整和異常的數據。如果采用這些數據進行預測,會導致預測成功率下降。由于數據量龐大且數據變量之間相互影響,必須對樣本數據進行預處理[8],對原始數據進行異常值的剔除、相關性分析等。
相關性分析是研究兩個及其以上處于同等地位的隨機變量之間的相關關系的統計分析方法。相關系數是一種定量描述兩組隨機變量的統計學相關性的指標。通過比較數組中的每個數對以確定兩組數據整體間的相關程度。當自變量取某一值時,因變量對應為一個概率分布,如果對于所有的自變量取值的概率分布都相同,則說明因變量和自變量是沒有相關關系的。反之,如果自變量的取值不同,因變量的分布也不同,則說明兩者是存在相關關系的。
影響因素既有產品自身的內在因素,也有外部因素[9],但該文從已知數據入手主要分析庫存量、標價、售價與折扣等因素。采用Pearson相關系數分析數據間的相似程度[10]。
原假設為H0∶r=0,則備擇假設為H1∶r≠0(其中,r為Pearson相關系數)。
如表1所示,國慶期間,在99%置信水平上,拒絕原假設,Pearson相關系數顯著異于0,即銷售量與庫存、售價相關。

表1 國慶相關性檢驗
目標單款商品銷售量的影響均與其庫存、售價相關,與產品的實際價格、節假日的折扣相關性不強[11]。
BP(Back Propagation)神經網絡是一種按誤差逆傳播算法訓練的多層前饋網絡,其拓撲結構包括輸入層、隱含層和輸出層,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。
BP神經網絡的算法具有良好的自適應性和分類識別等能力。其可以看作是一個函數映射,適用于有明確的輸入與輸出的對應關系,但其中的函數存在不容易確定的問題。而銷售量的預測可以看成將相關因素作為輸入,銷售量為輸出的復雜函數映射問題。因此,利用BP神經網絡對銷售量進行預測。
符號說明如表2所示。

表2 符號說明
輸入層:

隱含層:

其中,f(x)是激發函數,有多種形式:sigmoid函數、tanh函數、ReLU函數。該文采用sigmoid函數,該函數將取值為(-∞,+∞)的數映射到(0,1)之間。
sigmoid函數為:

輸出層為:

3.2.1 輸入層和輸出層的設計
根據相關性分析得出,影響目標skc銷量的因素主要有產品的售價以及產品的庫存量??紤]到節假日客流量大,人們的消費欲望明顯上漲,所以選取產品售價、庫存量以及節假日時長作為網絡的輸入層節點,商品的銷量作為輸出節點。故網絡結構含有3個輸入,1個輸出。
3.2.2 隱含層設計
4.1.1 訓練樣本預處理
由于樣本數據[13]中,不同變量之間數值的大小以及量綱不同,需要在訓練前進行數據預處理,將所有數據轉化在[0,1]范圍內,轉化方法采用標準化歸一化處理[14]。

選取對銷量有影響的相關因子(售價、庫存量)以及節假日時長作為網絡的輸入。
4.1.2 BP神經網絡結構初始化
在確定輸入層、隱含層、輸出層及相關神經元個數的過程中,該文選取了產品的售價、庫存量以及節假日時長,建立圖1所示的網絡結構,輸出節點為目標小類的預測銷量[15]。

圖1 神經網絡結構圖
4.1.3 生成隨機的神經網絡的權值與閾值
設定一定大小的迭代次數,以下函數作為相應的訓練函數。
輸出層誤差調整函數為:

隱含層誤差函數為:

輸入層誤差函數為:

通過輸入層、輸出層以及隱含層誤差函數的反饋,對BP神經網絡各節點的權重不斷調整優化。算法迭代停止時生成的值為訓練目標小類的預測值。
BP神經網絡預測模型的結果如圖2所示,該圖為一個商品小類的預測圖形,可以看出,模型的預測值與實際值比較接近,說明神經網絡的預測效果良好。

圖2 BP神經網絡預測模型實際值與預測值
如表3所示,MAPE誤差范圍小,進一步說明神經網絡的預測效果較好。

表3 預測商品小類MAPE
建立Pearson相關系數模型,深度挖掘數據之間的聯系,再通過BP神經網絡預測模型來精準預測市場需求,對商品的銷售情況能夠較好地預測[16],可以為新零售行業的庫存調配決策工作提供可靠的科學依據。在將來的預測中,應當盡可能地增加樣本數據以提高神經網絡預測的準確性。