張 文
(西安汽車職業大學,陜西 西安 710600)
在眾多的客戶畫像方法中,基于汽車駕駛行為的多維客戶畫像精準構建方法備受矚目[1]。在國外,一些先進的企業已經成功應用了這一方法,通過分析客戶的駕駛行為數據,為企業提供了更精準的市場定位和產品優化建議[2]。在國內,雖然相關研究起步較晚,但隨著技術的不斷進步和市場需求的增加,越來越多的學者和企業開始關注這一領域,并取得了一系列重要的研究成果[3]。本文將深入探討基于汽車駕駛行為的多維客戶畫像精準構建方法的理論與實踐,以期為未來的研究和實踐提供指導和啟示。
為了全面捕捉到不同維度客戶的敏感駕駛行為特點,本文在結合客戶不同特征的同時,從汽車駕駛系統中獲取數據,并分析多維客戶的多源特征,特征體系如表1所示。

表1 特征體系
整合表1,敏感度的計算式為:
(1)
其中,topic-count-positive(t)表示在正示例中顯示的主題數,a表示執行統一系數,t表示屬性數,topic-count-sum(t)表示在a中顯示的總主題數[4]。
在多維客戶多源特征體系的建立完成后,本文構建一個多視角融合模型,這一模型的設計理念是整合不同數據源的特征信息,從多個角度全面地描述客戶的特點,從而提高模型的預測準確性和泛化能力。通過雙層XGBoost算法,可以對不同特征進行權重分配,確保模型在處理高維特征時能夠準確地捕捉各個特征之間的關聯和重要性。
XGBoost作為梯度提升類算法中的一種優化模型,在計算過程中需要進行大量的改進,以便能夠提供更準確的結果。其主要改進方式包括分類回歸樹(Classification &Regression Tree,CART)模型和線性模型2種形式,本文主要通過CART模型對其進行改進,可以將CART模型視為基本的分類器,則相應的損失函數可以表示為:
L(Φ)=∑l(xi,yi)+∑Ω(afk)
(2)
(3)
其中,l表示樣本數量;yi表示真實類別;xi表示模型預測的類別;Ω表示示性函數,當條件為真時,則Ω取值為1,否則為0;λ表示真實值;ω表示模型預測值。對得到的結果進行標準化處理,標準化規則通常與CART模型中節點的值和數量有關,故采用L(t)作為二階導數,以完成標準化處理,計算過程可表示為:
(4)
在處理多源數據時,首先需要確定迭代的次數,然后使用XGBoost模型進行迭代。在迭代過程中,需要注意保留數據的所有特征分布,以便在第二層用作樣本。在第二層中,將XGBoost模型與其他模型相結合,實現多源數據的融合。
根據上述建立的多視角融合模型對客戶畫像的標簽進行分類,如圖1所示。

圖1 客戶畫像的標簽分類
其標簽分為上下文信息標簽W,資源信息標簽X和用戶信息標簽U,公式如下:
h(t)=fλ(UX(t)+Wh(t-1))
(5)
基于多視角融合模型,構建多維客戶畫像。具體的操作過程如圖2所示。

圖2 客戶畫像流程
以蔡少霖等[2]提出的基于K-means聚類分析的農產品消費群體畫像構建方法作為傳統方法1,程光勝[3]提的基于“大數據+小數據”的智慧圖書館用戶精準畫像模型構建方法作為傳統方法2,將傳統方法1、2與本文方法分別進行對比實驗。使用傳統的多分類問題的性能評價標準召回率作為實驗指標。該評估指標能夠對多維客戶畫像精準構建方法進行客觀評估,能夠充分考慮本次研究過程中涉及的整體和局部信息,召回率Recall公式如下:
(6)
該實驗基于Python環境,使用Keras作為框架。實驗中,考慮了N個主題(標簽)的名稱數量為10、20、50、100、200,對應的a值分別為0、1、0、2、0、4、0、6、0、8和1。定義ε值為0.5、0.6、0.7、0.8、0.9,s為3,n為1。選擇20%的數據作為測試集,余下數據用作實驗,本文共進行5次實驗,并使用5次評價指標作為最終的結果。經過反復實驗驗證,本研究中提出的客戶駕駛行為圖像構建的設計方法在a=6和ε=0.6時效果最佳。每種方法的最佳表現如表2所示。

表2 統計結果 單位:%
由表2可以看出,本文設計的基于汽車駕駛行為的多維客戶畫像精準構建方法得到的召回率較高,在利用召回率結果進行分析中,本文方法最大召回率和最小召回率均在0.4526%以上,高于傳統方法1和傳統方法2。實驗結果表明,本文設計方法的用戶畫像構建效果更好,有一定的應用價值。
基于汽車駕駛行為的多維客戶畫像精準構建方法是一種創新的客戶研究方法,它將客戶的駕駛行為與市場研究相結合,為企業提供了更深入、更精確的客戶洞察。通過本文的探討,深入了解了該方法的理論基礎和實踐應用,明確了其在實際操作中的挑戰和未來的發展方向。