慕善文 趙會群



摘要:精準營銷可以幫助企業節約營銷成本、提升營銷效果,基于大數據的消費者行為分析也是大數據領域的一個熱點研究。為此,基于運營商大數據對汽車用戶精準營銷算法進行研究,提出基于專家經驗與統計學方法的精準營銷算法。首先對用戶上網日志數據進行加工,得到用戶行為標簽,然后根據專家經驗與統計學公式計算用戶購車意向得分,輸出潛在購車客戶信息。通過在某運營商真實環境下進行實驗,驗證了算法的可行性與有效性。實驗結果表明,面向運營商大數據的汽車用戶精準營銷算法成功率可達到5.98%,相比現有推薦算法效率明顯提升。
關鍵詞:運營商大數據;專家經驗;汽車營銷:精準營銷
DOI: 10. 11907/rjdk.191273
開放科學(資源服務)標識碼(OSID):
中圖分類號:TP319
文獻標識碼:A
文章編號:1672-7800( 2020)001-0148-04
0 引言
大數據目前已成為人們關注的熱點之一,隨著計算機技術的迅速發展,人們對大數據的分析也越來越深入,并將其應用于各個領域,可以說如今人們已生活在一個大數據時代。為了適應時代需求,各行業都發生了變革,營銷行業也是其中之一。傳統營銷模式在大數據的沖擊下正慢慢被精準營銷取代。與傳統營銷模式相比,精準營銷既能節省營銷成本,又能最大化營銷效果[1-3]。
出于保護用戶隱私等因素,通常企業不會公開自己的數據,使得新客引入成為一個難題。傳統營銷模式存在新客戶增長速度緩慢且成本高昂等問題,長此以往不利于企業發展。運營商作為移動網絡的經營者,擁有其它企業無法企及的海量數據資源[4-6]。企業利用通信運營商大數據進行精準營銷有利于企業新客戶引入與老客戶復購。所以研究面向運營商大數據的精準營銷算法對企業而言顯得尤為必要。
本文研究來自企業項目,基于運營商大數據構建企業精準營銷數據分析模型,在運營商大數據中篩選購車意向較高的用戶,以幫助汽車企業實現對用戶的精準營銷。
1 相關研究
眾多學者針對基于大數據的精準營銷進行研究,如Liu等[7]針對服裝企業營銷問題,基于4C理論構建“人物”數據庫,通過挖掘數據庫對消費者進行細分,并在此基礎上,從營銷角度建立精準的營銷細分模型;Zhang等[8]提出一種基于電信大數據挖掘的高檔汽車營銷模型以預測潛在的高端豪華車購買者,采用邏輯回歸算法與神經網絡挖掘算法構建預測模型。但由于運營商掌握的數據粒度無法像企業自身掌握的那么精細,可能使機器學習建模結果受到影響;Chen等[9]針對汽車銷售的個性化推薦需求,提出汽車個性化分析與推薦模型,根據用戶購車行為習慣建立評估算法,通過機器學習方法訓練評估模型參數,從而獲得用戶購車排名,并通過真實數據集測試了算法有效性。但其提出的極大似然估計評估模型,僅考慮了少量汽車選擇條件概率,從概率論角度評估模型的完備性不夠充分,評估效果自然會受到影響;Peng等[10]采用爬蟲技術對用戶瀏覽汽車網頁的行為進行收集分析,然后對收集到的信息進行順序化處理與清洗,在此基礎上使用Apriori算法挖掘用戶瀏覽網頁的行為關聯規則,從而為網站提供個性化的用戶信息,以便為用戶推薦感興趣的汽車信息;Oiao-man[11]介紹基于分布式處理技術的分析挖掘技術,設計并實現了基于電信網絡包業務平臺的精準營銷系統。該方案使用K-means劃分基于用戶的業務支付特征,Hadoop用于算法的并行實現。基于M apReduce實現的精準營銷應用還有很多[12-15],借助MapReduce強大的批數據處理能力,可以很好地實現對數據的清洗任務;文獻[16]-[18]介紹了基于貝葉斯推斷的推薦算法。
其中,本文研究方法與文獻[7]相似,都采用了大量專家經驗,但研究領域不同,研究的數據也不同;本文研究與文獻[8]、[9]相比,優勢在于本文研究重點是用戶行為分析,通過對用戶行為的分析計算意向性得分,通過處理用戶上網日志分析用戶行為,結果不受其它數據影響;文獻[10]與本文研究都是根據用戶瀏覽網頁的痕跡信息挖掘用戶喜好,推薦個性化服務,但與本文研究不同的是,該研究僅使用傳統Apriori算法發現關聯規則,而沒有開發新的算法;與文獻[11]相比,本文算法的優勢在于其是基于Spark實現的,計算速度更快;與文獻[16]-[18]相比,本文研究可以有效地克服冷啟動與數據稀疏問題。
2 汽車精準營銷算法
設s表示用戶購車意向分數,be表示行為得分,p表示價格契合度,br表示品牌契合度,。表示汽車類APP偏好得分。s定義為:
s=be×p×br×a
根據專家經驗.各因子對用戶購車行為影響大小的關系為be>p>br>a。be由用戶上網瀏覽痕跡計算得出,相比其它因子更能反映出用戶關注的內容;其次是p,價格通常是用戶在購車過程中考慮的重要因素;然后是br,在用戶購車過程中,一般也會考慮汽車品牌;最后是a,用戶可以通過汽車類APP了解汽車信息,也可以通過其它渠道了解,加上汽車類APP種類繁多,大多存在購車功能,導致a相比其它因子對用戶購車意向影響較小。
行為是指用戶在汽車類APP上瀏覽時的操作,行為對用戶購車意向的影響稱為行為權重,記為w,根據專家經驗得出不同行為權重大小關系為:提交個人信息獲取底價>查看經銷商>車型對比>查看貸款購車>查看購車計算器>詢底價>預約試駕>提車。設t表示該行為發生的次數,be定義為:
式(2)可以用JAVA Math類中的loglp方法實現,利用該方法參數與1求和的自然對數,可實現對數值的平滑處理。隨著某行為發生次數的增加,次數對行為得分的影響逐漸降低,行為得分保持平緩增長。
價格契合度表示用戶瀏覽汽車價格的穩定性,價格契合度越高,表示用戶瀏覽汽車的價格越接近,越低則代表表示用戶瀏覽汽車的價格波動越大。通常價格契合度越高,用戶購車意向越強。p定義為:
品牌契合度反映用戶瀏覽汽車品牌的集中性。品牌契合度越高,說明用戶對某品牌的關注度越高,購買該品牌的意向越強烈。設用戶瀏覽車系對應品牌的出現次數為bsi,用戶瀏覽的車系數量為bs,br定義為:
br=√bsi|bs
(6)
將汽車類APP分成兩類,一類是汽車愛好者類APP,一類是購車類APP。設購車類APP出現次數為at,APP出現總次數為sat,a定義為:
a=1+at/sat
(7)
根據以上分析,面向運營商大數據的汽車精準營銷算法流程如圖1所示。
精準營銷算法偽代碼為:
Input:用戶上網日志
Output:潛在購車用戶信息
1.begin
2.讀取行為權重和汽車信息;
3.廣播行為權重和汽車信息;
4.i=0:
5.repeat
6.獲取行為權重和汽車信息廣播值;
7.car= carlnfo;/*關聯汽車信息*/
8.w= behaviorWeight;
9.if(汽車價格不為O)then
10.do totaIPrice= totalPrice+ t*ori_price;/*總價*/
11. be=be+ w*loglp(t+1);/
12.
totalAudi= totalAudi+ audi;
13.
brandList= brandList+ hrand:
14. if(audi>l|| audi==l &t>1)then
15.
do avgPrice= totaIPrice/t;
16.
avgWeigPrice= sum( be*avgPrice) /smu( be);
17.
p=pow (0.5, abs (avgPrice - avgWeigPrice), avg-WeigPrice);
18.
br=sqrt( brandList.length/totaIAudi);
19.
if(是購車類APP) then
20. dox+x+t:
21.
a=l+x/t;
22.
s=be*p*br*a
23.
else
24. do delete midResult[i];
25. else
26. do delete midResult[i];
27. until i
28.文件輸出
29. end
3 實驗研究
3.1 數據準備
實驗所需用戶上網日志樣例如圖2所示。
對圖2中數據進行預處理后,在HDFS上輸出的中間結果如圖3所示。其中,手機號已經過脫敏處理,APP和行為均使用編碼代替。具體實驗環境如表1所示。
3.2 結果分析
通過兩組實驗驗證以上提出的算法。
第一組實驗選取5天的汽車用戶上網日志數據,采用天數逐漸遞增的方式讀取數據,即第一天讀取一天的數據,第二天讀取前兩天的數據,以此類推直到第五天讀取前五天數據。實驗數據集如表2所示。
分別在5個數據集上運行以上提出的精準營銷算法,然后根據客戶實際需求,在每天輸出結果中取分數最高的前1 000個用戶進行外呼營銷。同時,采用某運營商現有推薦算法篩選出1 000個用戶進行外呼營銷。二者成功用戶數對比如圖4所示。此處的成功是指利用營銷話術進行推薦后,成功要到用戶聯系方式。
從圖4可知,在5天的數據集中,面向運營商大數據的汽車精準營銷算法的成功用戶有299人,成功率為5.98%,高于某運營商現有推薦算法,其成功用戶共有53人,成功率為1.06%。
根據程序輸出日志統計結果,算法在不同數據集下運行時長如圖5所示。
從圖5可知,面向運營商大數據的汽車精準營銷算法處理20G數據量需要lOmin左右,隨著數據量的增加,消耗時間的增長趨勢減緩。目前在公司內,通常情況下采用7天數據運行一次算法,預計耗時0.5h以內。在硬件資源固定的情況下,該時間可以被企業接受。
第二組對比實驗場景為汽車線上廣告。企業與某互聯網廣告平臺合作,進行汽車線上廣告營銷。合作方提供9 000個帶標簽的運營商用戶信息,其中可以識別的特征有終端、話費、APP偏好、購物偏好等共52個,去除其中的無效特征,選擇其中的22個特征作為輸入,用這些數據分別訓練Spark MLlib中的邏輯回歸算法與決策樹算法。分別采用面向運營商大數據的汽車精準營銷算法與上述兩種算法篩選出100萬個用戶,對其進行互聯網廣告營銷,分別統計每種算法的廣告點擊率,實驗結果如表4所示。
面向運營商大數據的汽車精準營銷算法優勢在于對輸入數據的要求低于邏輯回歸算法和決策樹算法。主要體現在:
(1)面向運營商大數據的汽車精準營銷算法對原始數據的加工次數少于邏輯回歸算法和決策樹算法,只需對用戶上網日志數據加工一次即可得到所需的輸人數據,而邏輯回歸算法和決策樹算法需要消耗更多的集群資源與數據資源對其所需的特征數據作多次加工,導致企業營銷成本增加。
(2)邏輯回歸算法和決策樹算法非常依賴特征數據選取與訓練數據集,若選擇無效特征或訓練數據量不夠,都會影響算法準確性。然而,面向運營商大數據的汽車精準營銷算法通過用戶上網日志分析用戶行為,可以大大降低無效特征的影響;采用專家經驗和統計學公式計算用戶購車意向得分,其結果不受訓練數據量影響。
上述實驗結果充分表明面向運營商大數據的汽車精準營銷算法具有一定的可行性與有效性。
4 結語
由于不同行業用戶需求的多樣性,提出一個普遍適用的精準營銷算法是非常困難的。本文提出的面向運營商大數據的汽車精準營銷算法結合了專家經驗與統計學相關計算方法,可以幫助企業在運營商大數據中找到購車潛在客戶。主要工作為:①提出用戶購車意向分數計算方法,該方法對于汽車行業的精準營銷具有一定借鑒意義;②提出面向運營商大數據的汽車精準營銷算法,基于算法實現的程序現已部署在運營商集群中,為合作企業帶來了一定收益。
然而,本文研究還有需要完善的地方,如需要進一步提升算法成功率與執行效率。另外,提升算法在不同行業精準營銷的適用性也是下一步研究的重點。
參考文獻:
[1] 嚴明.基于大數據的精準營銷應用研究[D].蘭州:蘭州交通大學, 2016.
[2]林權,盧軍,嚴雄偉.基于大數據的運營商精準營銷系統應用研究[J].電子測試,2016( Zl):51-54.
[3] 陳鵬.基于大數據的A房地產公司精準營銷研究[D].大連:大連海事大學,2016.
[4] 張云勇,電信運營商大數據發展建議[J].電信科學,2018(1):103-108.
[5] 陳科帆,周洪成.電信運營商大數據資源變現模式及策略研究[J].移動通信,2016(1):63-67.
[6]李研,高書波,馮忠偉.基于運營商大數據技術的精準營銷應用研究[J].信息技術,2017(5):178-180.
[7]LIUH,HUI L U. RUAN J, et al. Research on precision marketing seg-mentation model based on mining“persona”[J]. Journal of Silk,2015,52( 12):37-42.
[8]ZHANG H,ZHANG L, CHENC X. et al.A novel precision marketingmodel based on telecom big data analysis for luxury cars[C].Interna-tional Symposium on Communications&Information Technologies,2016:307-311.
[9]CHEN Z, FENC Y. LI H.A novel Top-K automohiles prohabilisticrecommendation model using user preference and user communitv[C]. 2014 IEEE llth International Conference on e-Business Engi- neering,2014: 105-111.
[10]PENG Y,YU K.User hehavior analysis of automobile websites basedon distrihuted computing and sequential pattern mining [Cl. 2016 IEEE International Conference on NetWork Infrastructure and DigitalContent.2016:84-88.
[11]LIU Q.Design and implementation of precision marketing system un—der cloud computing environment[C].2017 International Conferenceon Smart Grid and Electrical Automation. 2017: 231-234.
[12] 曾小青,張若欣,歐陽文光,等.大數據環境下精準客戶定位的社交網絡分析[J].計算機工程與應用,2017( 15):85-94.
[13] 盧坤.云平臺上日志存儲與分析系統關鍵技術研究[D].合肥:中國科學技術大學,2015.
[14] 張韜.基于在線視頻用戶數據的DMP系統的設計與實現[D].北京:北京交通大學,2016.
[15] 鄒倩穎,王小芳.改進遺傳算法在實體商業中精準營銷研究與實現[J].現代電子技術,2018,41( 13):185-189.
[16] 范敏.基于貝葉斯網絡的學習與決策方法研究及應用[D].重慶:重慶大學,2008.
[17] 吳瓊玲.貝葉斯網絡模型在旅游大數據分析中的應用[D].哈爾濱:黑龍江大學,2018.
[18]姚衡.基于貝葉斯網絡的大數據因果關系挖掘[D].昆明:云南財經大學,2016.
(責任編輯:黃健)
基金項目:國家自然科學基金項目( 61672041)
作者簡介:慕善文(1993-),男,北方工業大學信息學院碩士研究生,研究方向為大數據處理;趙會群(1960-),男,博士,北方工業大學信息學院教授,研究方向為軟件工程和大數據收理。