林明輝
(安徽新華學院商學院,安徽合肥 230031)
基于PCA和BP網絡的線上零售客戶價值細分研究
林明輝
(安徽新華學院商學院,安徽合肥 230031)
在互聯網經濟和大數據營銷環境下,正確識別客戶、細分客戶是發掘潛在客戶和維系老客戶、提供精準營銷和差異化營銷的關鍵所在。本文通過PCA主成分分析,對指標進行降維處理,消除指標間信息重復,運用BP網絡高度的非線性映射能力對客戶價值細分指標進行收斂訓練,最終得到擬合度較高的因子權重分布,為建立以消費行為為導向的在線零售客戶價值模型提供參考和借鑒。
主成分分析;BP網絡;客戶價值細分
隨著OTO經濟和移動互聯技術的發展,傳統零售行業逐漸將重心轉移到用戶規模龐大、利潤可觀的電子商務市場。互聯網環境下的消費者購買行為具有更大的隱蔽性和可誘導性,競爭對手的策略滲透交互干擾著消費者的決策過程。正確識別目標客戶、有效引導消費行為成為企業降低營銷成本、獲得核心競爭優勢的關鍵,差異化、個性化的產品和服務可以更好地滿足消費者的需求,也會進一步鞏固和提升客戶的忠誠度。
客戶價值細分是動態營銷和精準營銷的一個重要研究課題。在大數據環境下,企業面臨著海量的用戶消費數據和個性化行為過程記錄。挖掘、識別、歸類有效數據,實現客戶價值細分是企業營銷戰略所要解決的首要問題。目前,國內外學者對客戶價值細分的研究成果主要集中于某些種類的行業應用,如服裝業、零售業、通信業等。湯海霞利用協整矩陣分析客戶通信費用以及通話時長等數據的變化趨勢,預測客戶消費行為偏好和離網傾向[1]。Alex. Berson等人從客戶關系管理的角度出發,利用決策樹和聚類分析理論研究零售業客戶細分[2]。蒙肖蓮等利用數據挖掘技術建立基于個人信用體系的商業銀行客戶價值識別模型,為金融行業綁定優質客戶、延伸客戶價值貢獻提供了判斷標準。劉芝怡在基于改進K-means算法的RFAT客戶細分研究中,將客戶最近購買時間(Recency)、購買頻次(Frequency)、平均購買額(Average Monetary)和購買傾向(Trend)作為客戶價值細分變量,對零售業客戶進行分類[3]。基于上述研究,本文從另一微觀角度進一步研究特定消費群體(網上零售客戶)的購買行為傾向。通過監測收集消費者使用互聯網和移動數據終端進行網絡購物的行為數據樣本,使用PCA和BP神經網絡構建基于網絡消費行為指標的客戶細分模型,并利用BP網絡的自我學習效應重構網絡消費群體價值分類體系。
消費行為是消費者在收集商品信息、甄選商品信息并最終作出購買決策過程中所表現出來的一系列行為。理性的消費者在單次消費中所表現出來的行為具有一定的獨立性。通過學習效應,消費者的多次購買行為將趨向類同性[4]。實踐證明,消費者在單位價值較低、品牌差異度較小的商品購買決策中,增加了購買經驗,其交易成本和時間成本大大減少,并呈現出相似的購買決策行為特征。
為了收集完備的客戶消費行為指標,我們通過頭腦風暴的方式,進行多輪論證,最終形成了以3類標準、26評價維度組成的基礎評價體系。在數據準確性方面,采用某大型消費類電子商務門戶網站的實名注冊用戶信息及其后臺數據為研究對象。3類評判標準分別為個人信息變量、消費決策變量、消費結果變量。
1.1 個人信息變量
該變量主要反映消費者的基本情況,例如性別、年齡、職業、教育程度、個人收入、網絡消費支出等數據來源于注冊會員的實名登記信息。
1.2 消費決策變量
該變量主要反映消費者在從進入網絡零售界面(接觸)到完成交易(退出)過程中產生由在消費動機驅動的購買決策行為,是潛在客戶轉變為現實客戶的過程體現。例如,瀏覽目錄級次、頁面停留時間、注冊綁定銀行卡數、持卡類型等來源于網站數據中心的日志處理模塊(Log Preprocessing)。
1.3 消費結果變量
該變量主要反映消費者交易支出情況以及購買后的行為,是顧客滿意度和忠誠度的主要檢測指標,例如日交易支出、累計交易支出、咨詢投訴成本、推薦他人購買、分享購買信息等是客戶價值測定的關鍵指標,來源于財務數據庫以及售前支持和售后代理數據庫。
表1 客戶價值細分指標列表
神經網絡是人工智能的方法之一,通過模擬生物神經網絡功能來解決各個領域的實際問題,其中應用最廣的是BP網絡。BP(back propagation)網絡是一種利用誤差逆傳播算法訓練的多層次前饋神經網絡。輸入層初始化權值后,通過隱藏層正向傳播信號,若輸出層不能得到理想的結果,則通過隱藏層反饋誤差信息,逐層修正連接權,經過多次的學習和訓練,在信號交替傳遞過程中實現網絡誤差的最小化[5]。
PCA主成分分析法是指將給定的一組變量指標,通過線性變換轉化為另一組綜合度更高的變量指標簇的統計分析方法[6]。在變換轉化過程中,根據指標對信息對象的解釋程度,重新歸類定義綜合變量。實際上,綜合變量是原來的線性組合。由于初始指標之間或多或少具有一定的相關性,在對實際問題的表述上存在信息重疊。從描述統計的角度看,主成分分析法能更加集中地概括出數據的本質特征,體現數據的內部結構。
BP神經網絡也存在一些局限性,如收斂速度慢、初始權值的選擇缺乏依據等。同時,本研究所采集的指標數據較多,指標之間存在一定的相關性,因此應利用PCA法對指標進行降維,將得到的主成分作為初始數據進行BP網絡信號輸入[7]。
3.1 PCA主成分分析
3.1.1 建立原始客戶細分指標矩陣
3.1.2 指標矩陣進行標準化
在同一量綱規范內,均值和方差可以對數據指標進行標準化操作,而本研究的指標參數在量綱的橫向比較上存在不一致,為了避免量綱不同而產生“偽偏和現象”,我們選用線性無量綱極值法對數據指標進行標準化處理[8]。
由此可得V=(vki)m×n.
3.1.3 數據歸一化
歸一化是一種簡化計算的方式,即將有量綱的表達式,經過變換,化為無量綱的表達式,成為標準量,縮小量值差距,歸一化的數值頻動范圍在[0,1]之間。
3.1.4 計算相關系數矩陣
3.1.5 計算特征值和特征向量確定主成分貢獻率
3.2BP網絡自適應算法
(1)初始化,對輸入層至中間層的連接權值Wij(i=1,2,…,n;j=1,2,…,p)中間層至輸出層的連接權值Vjt(j=1,2,…,p;t=1,2,…,p),以及中間層各個單元的輸出閾值θj,輸出層各個單元的輸出閾值γj,賦予(0,1)內的隨機值;
(2)提供p個學習樣本X1X2…Xp,目標樣本T1T2…Tp和輸出值Y1Y2…Yp;
(3)計算輸出,利用sigmoid函數,用輸入層樣本X1X2…Xp,輸入層至中間層的連接權值Wij,中間層各個單元的輸出閾值θj,計算中間層輸出Sj;
(4)利用中間層輸出Sj,中間層至輸出層的連接權值Vjt,輸出層各個單元的輸出閾值γj,通過傳遞函數,計算輸出層輸出Lj;
(5)比較計算目標向量與實際輸出的一般化誤差,利用Lj,Vjt計算中間層各單元一般化誤差,進而修正連接權Vjt和閾值γj,同理,利用中間層各單元一般化誤差和修正后的Vjt,逆向修正連接權Wij和閾值θj;
4.1 樣本選取
本研究以某大型消費率電子商務門戶網站的實名注冊用戶為調查對象。其中,客戶個人特征信息來源于注冊用戶個人所填寫的信息,顧客消費行為特征數據采集于后臺數據監控中心,消費結果信息來源于交易數據中心。同時通過問卷調查,模擬部分情景進行數據測試,確保行為特征數據能代表客戶的真實意愿,同時修正了部分不對稱的信息。
4.2 主成分分析
選取100位零售業的專家和經常網購的消費者對上述細分指標進行評定,對部分非量值指標,如性別、教育程度、職業、支付方式等進行數值化預處理,對收入支出類數據用均值進行標準化處理。結合Matlab軟件對客戶消費行為數據進行主成分分析,其中累計方差貢獻率超過85%的有5項(表2)。
表2 主成分特征值及方差貢獻率
由表2可以看出,前5項主成分方差在總方差中占比90.662%,超過85%的判斷標準,可以代表原來的26項細分指標,5項主成分形成的網絡輸入向量經過標準化后部分如表3所示。
表3 網絡輸入部分數據表
4.3 網絡訓練及學習結果
表4 網絡訓練誤差表
由表4可知,神經元個數為14個時,網絡誤差值最小,建立5個輸入節點、14個隱含節點、1個輸出節點的BP網絡。使用傳遞函數traingdx進行2593次學習,網絡在精度0.001的誤差范圍內收斂且穩定(圖1)。
圖1 BP網絡誤差收斂曲線
4.4 結果檢驗
為了驗證模型的準確性,使用同批次剩余的20個測試樣本作為輸入值,通過驗證誤差、訓練誤差和測試誤差比較可以得到,模型的擬合性較高,適應性較好(圖2)。
圖2 驗證誤差、收斂誤差、測試誤差對比圖
消費者的購買行為影響因素眾多,除了個人心理特征外,環境因素和營銷刺激也會改變消費者的購買動機。為了將消費動機具象化,本研究從消費者行為結果出發構造消費者決策過程變量,運用主成分分析法提取典型的具有代表性的特征指標,作為區分不同客戶屬性的標識,降低了指標的復雜性,同時也優化了BP網絡輸入效率,提高了網絡的學習效率和泛化能力。
通過研究,我們找出了在線零售客戶價值細分的行為特征指標,通過因子權重分析,發現客戶價值不僅表現為消費者當期消費為企業所帶來的收入,還表現在客戶潛在需求的滿足程度、對企業的產品和服務的滿意度和忠誠度、對企業形象和價值的傳播和推廣意愿。鑒于此,企業應該在促銷優惠、會員制個性化管理等方面,進一步豐富用戶購買過程的體驗性,提高他們的購買滿足感,增加用戶粘性,進而為企業帶來長遠的價值。
[1]湯海霞.移動通信企業客戶管理模型與方法研究[D].南京:東南大學,2014.
[2]Carrie M1Heilman,Kent Nakamoto.Pleasant Surprises: Consumer Response to Unexpected In-Store Coupons[J]. Journal of Marketing Research,2002(2):242-234.
[3]劉芝怡,陳功.基于改進 K-means 算法的RFAT客戶細分研究[J].南京理工大學學報,2014(8):532-533.
[4]董長虹.Matlab神經網絡與應用[M].北京:國防工業出版社,2007.
[5]劉朝華,梅強,蔡淑琴.基于RFM的客戶分類及價值評價模型[J].技術經濟與管理研究,2012(5):33-36.
[6]朱艷麗.基于消費行為的客戶細分模型應用研究[D].成都:四川師范大學,2007.
[7]王克富.基于數據挖掘技術的AFH客戶分類應用研究[J].技術經濟與管理研究,2012(11):24-28.
[8]翁淑珍.網絡消費行為與傳統消費行為的比較分析[J].產業觀察,2014(3):23-24.
2015-06-29
林明輝(1982-),男,福建福州人,安徽新華學院商學院講師,碩士,從事客戶關系及消費者行為研究。
F724.2
A
2095-7602(2015)12-0167-05