黃成明 張榮臻 林新輝


摘要:本文針對農產品電商平臺進行精準營銷的過程中使用BP神經網絡訓練用戶數據建立模型時,針對數據量巨大導致BP神經網絡模型成型慢的問題,提出了一種基于改進BP神經網絡算法的農產品個性化推薦模型。首先將用戶數據進行漢明編碼,并用漢明距離度量用戶相似度,在此基礎上將數據進行預分類。然后將此預分類結果集進行抽樣,作為BP神經網絡的輸入,來提升建模速度。
關鍵詞:精準營銷;K近鄰算法;BP神經網絡;農產品電商
1引言
電商平臺的精準營銷解決方案,業界較為流行的是采用例如基于關聯規則、K近鄰、BP神經網絡等算法,對用戶進行相似性度量,從而將某些具有較高相似度的群體進行歸類,從而實現精準營銷。但由于農產品電商平臺動輒幾億的用戶數據,且農產品的消費行為具有嚴重的高噪聲、非線性、多維特征等特點,導致在使用人工智能算法建立精準營銷模型時速度過慢[1]。針對上述問題,本文提出了基于K近鄰算法改進BP神經網絡訓練模型的過程,有效地提高了生成模型的速度,對具有海量數據的農產品電商平臺實現精準營銷具有重要的應用價值。
2BP神經網絡農產品精準營銷模型
2.1農產品精準營銷原理
農產品的消費行為受多種因素的影響,如農產品的價格、供需關系、各地區的消費水平、甚至農產品的培養地區、培養方式、消費者個體偏好、季節因素、天氣因素等。通過對大量數據的分析,定性分析出對農產品消費行為影響較大的特征主要有以下幾個:
1)季節。農產品的生長具有較強的季節性,消費者對農產品的購買與月份具有強關聯性。
2)消費水平。消費者消費能力的不同,對農產品需求的品類也不同。
3)消費者地域。由于大部分的農產品具有濃厚的地方特色,相同地域的消費者在購買農產品時有著很高的相似度。
4)消費者歷史購買記錄。消費者經常購買的品類,重復購買的概率較大。
對農產品進行精準營銷,其本質上是對消費者的屬性通過合理的特征提取構建一個特征數據集,通過對特征之間關系的計算,建立一個分類模型,通過對消費者進行群體劃分從而實現精準營銷。
2.2BP神經網絡及其改進
BP(Back Propagation)神經網絡是當前應用最廣泛的人工神經網絡[2],針對使用BP神經網絡算法在農產品電商平臺擁有海量用戶數據的背景下進行精準營銷時面臨建模速度慢的問題,本文提出基于KNN算法改進BP神經網絡的迭代過程,提升訓練速度。基本步驟如下:
步驟1 數據預處理。對樣本數據進行主成分分析提取特征,并對數據進行清洗,去除無效值。然后對特征進行漢明編碼。最后將數據分為訓練集和測試集。
步驟2 初始化KNN算法參數。K值選擇奇數避免投票中出現類別數相同的狀況,以交叉驗證法確定最終K值[3]。
步驟3 計算樣本數據的距離。本文采用漢明距離度量樣本數據點之間的距離[4]。
步驟4 得到KNN分類的結果。最終分類結果為D=[D1,D2,D3,D4……],D表示結果數據集,D1,D2,D3,D4等分別表示對應某一類別標簽的分類結果集。其中D1 = [X1,X2,X3,X4,X5……],其他數據項依次類推,X為樣本數據,Y為該群體對應的分類標簽。
步驟5 BP神經網絡參數初始化。確定BP神經網絡參數的初始值,如初始權重、初始學習率、閾值、隱含層節點數、神經網絡層數、抽樣系數等。
步驟6 將KNN分類結果D1,D2,D3,D4中的樣本乘以抽樣系數進行隨機抽樣,并分別作為BP神經網絡的輸入。
步驟7 計算輸出層的實際輸出,并計算與期望輸出的誤差,同時計算隱含層神經元梯度項,對權重值和閾值進行修正。
步驟8 生成BP神經網絡模型。當損失函數達到預設值則迭代結束。否則轉入步驟6繼續進行下一輪學習。
基于KNN算法改進的BP神經網絡算法結構如圖1所示。
3實驗結果與分析
本實驗選取的樣本數據包含消費者歷史購買記錄、季節、消費水平、消費者地域等四個特征。這些特征作為BP神經網絡的輸入,輸出為生鮮類、時蔬類、肉類、瓜果等四個類別標簽。本次實驗為了驗證本文提出方法的有效性,從訓練速度和BP神經網絡模型的準確率兩個維度來進行對比實驗。如圖2所示為抽樣系數和訓練速度關系曲線可視化圖形,當抽樣系數取不同值時,訓練速度也不同,訓練速度隨著抽樣系數的增大而減小。
本文測試了不同抽樣系數下生成的神經網絡模型在測試數據集上的表現,觀測到本文提出的方法在有效的加快了訓練速度的同時,并未對模型的準確率產生影響,證實了本文方法的有效性。
4結束語
針對農產品電商精準營銷領域面臨的非線性、信息冗余度高、數據量大、采用BP神經網絡訓練數據時建模慢等問題,本文提出了一種基于KNN算法改進BP神經網絡迭代過程的方法。本文通過實驗驗證了此方法在保證模型準確率的基礎上有效的提升了BP神經網絡的訓練速度,在農產品的精準營銷上具有重要的應用價值和經濟效益。本方法雖然提升了農產品電商平臺BP神經網絡模型的訓練速度,卻增加了預分類的時間開銷,故本方法在擁有海量數據的電商平臺表現較好,可以大幅降低訓練數據量,對于其他領域的普適能力,有待進一步研究。
參考文獻
[1] 王赟松, 褚福磊, 何永勇,等. BP神經網絡快速收斂算法研究[J]. 農業機械學報, 2004, 035(006):182-184.
[2] 吳微, 陳維強, 劉波. 用BP神經網絡預測股票市場漲跌[J]. 大連理工大學學報, 2001, 41(001):9-15.
[3] 張寧, 賈自艷, 史忠植. 使用KNN算法的文本分類[J]. 計算機工程, 2005, 31(008):171-172.
[4] 申金緩, 張文偉, 等. 利用漢明距離優神經網絡學習樣本[J]. 光學學報, 2000.