











摘 要:為了能夠高效、精準地實現體育用品客戶類別的細化定位,支撐體育用品銷售企業的營銷策略制定、企業產品推廣及發展規劃制定,提出基于消費數據挖掘的體育用品客戶精細化定位方法。本文基于層次分析法(AHP)的層次結構設計邏輯,構建體育用品客戶消費行為數據采集指標體系,對應分析體育用品客戶消費行為數據采集的整體邏輯,構建包含消費行為特征的體育用品客戶消費數據集。利用RBF核函數對數據集中的指標數據進行預處理,通過核函數超參數來控制數據向量在高維特征空間的映射狀態,獲取消費行為特征域,實現消費行為特征提取。將獲取的特征域作為消費數據基點,構建體育用品客戶消費畫像。基于k-means聚類方法,將包含關鍵消費特征指標的客戶消費數據作為輸入,實現體育用品客戶精細化定位。實驗結果表明:在測試過程中,利用本文設計方法所產生的體育用品客戶精細化定位精度較高,整體細化定位過程較穩定,設計方法產生準確率為0.91,召回率為0.92,F1值為0.95,G值為0.91,具有較好的實際應用性能。
關鍵詞:數據挖掘;k-means聚類算法;消費行為;體育用品營銷;客戶細分定位
中圖分類號:TP311.13;F274" 文獻標識碼:A" 文章編號:1673-260X(2024)12-0053-05
收稿日期:2024-09-17
基金項目:安徽省哲學社會科學規劃項目(AHSKY2023D077)
在體育文化產業深入、持續建設的背景下,體育用品行業客戶群體的多元化、個性化需求逐漸成為推動體育用品行業優化發展的重要基礎[1,2]。隨著數字化時代來臨,體育用品行業為了更全面地了解客戶群體的基本需求,通常會以客戶群體的真實消費偏好為基準,細化目標客戶群體,對應進行市場定位與體育產品營銷策略規劃。
在客戶細化與定位研究中,文獻[3]融合最小二乘法、模糊聚類方法、C均值聚類分析方法,對客戶群體進行聚類分析,分析客戶群體內部的相互影響關系,實現客戶細化定位。文獻[4]將客戶偏好挖掘與客戶交互行為分析分別進行建模,并將其作為兩階段的多行為推薦學習任務,每一部分任務都針對性地實現了群體特征信息交替訓練,在避免數據稀疏性問題的同時,實現客戶細化定位。文獻[5]結合灰色關聯分析方法,將時間向量的相似度度量問題進行矩陣分解,并利用自適應核密度估計方法提取矩陣空間的客戶偏好,實現客戶細化定位。文獻[6]提出一種基于用戶視角的客戶協同信息推薦算法,結合知識感知信息,設計嵌入式注意力傳播機制,獲取客戶項目交互知識圖譜中的高階特征信息,基于特征信息進行客戶視角的協同信息交互路徑聚合,有效實現了客戶群體的細化定位。基于此,本文提出基于消費數據挖掘的體育用品客戶精細化定位方法。
1 體育用品客戶精細化定位方法設計
1.1 體育用品客戶行為數據采集
為了實現體育用品客戶精細化定位,首先需要基于層次分析法(AHP)的層次結構設計邏輯,整合體育用品銷售中的線上數據源與線下數據源,采集體現體育用品客戶消費行為屬性的消費數據[7]。同時,為了便于分析明確不同客戶消費數據的屬性關聯,將采集的數據類別定義并細化為不同層級的數據指標,形成層次結構,以保障每個層級的指標都具有邏輯關聯性,體現體育用品客戶消費行為數據采集的整體邏輯[8]。體育用品客戶消費行為數據采集指標體系如圖1所示。
由圖1可知,體育用品客戶消費行為數據采集指標體系主要由目標層、準則層、指標層與來源層構成。其中,目標層是指標體系的最頂層,該層定義了整個指標體系的總目標為體育用品客戶消費行為數據,在數據收集過程中目標層可以定義為客戶消費行為的一種深入理解。準則層位于目標層之下,用于將總目標分解為若干個具體的行為數據類型定義準則,這些準則能夠全面覆蓋客戶消費行為的各個方面。
指標層從層次判別邏輯上來說屬于指標體系的底層結構,包含了用于衡量各個準則層目標的具體指標,此處為對應性的具體體育用品客戶行為數據。其中,指標層呈現的要素為需要采集的體育用品客戶消費行為數據,此處將其定義為年度體育用品消費總額(目標客群中的單一客戶)a1,年度體育用品消費頻率a2,客戶購買周期(客戶兩次購買體育用品之間的平均時間間隔)a3,客戶消費狀態a4,體育用品購買渠道a5,體育用品商品類別偏好(對不同體育用品類別的消費偏好和購買頻率)a6,品牌忠誠度a7,體育用品購買時段偏好a8,客戶促銷敏感度a9,客戶購物車數據a10,線上購物瀏覽行為a11,線上購物搜索行為a12,售后服務反饋a13,客戶個人信息a14,客戶社會經濟特征信息a15。此處對采集數據進行歸一化整理,生成包含n個樣本的數據集N。n表示所輻射體育用品目標客戶群中客戶的數量,第n個客戶消費數據集合為A=[a1,a2,a3,…,a15]。
來源層是整體客戶消費行為數據的重要基礎,為體育用品客戶行為數據的采集提供主要數據來源。該層要素分別對應了指標層行為數據的重要來源,如體育用品零售商銷售平臺數據庫、用戶關系管理CRM系統、線上電商平臺與移動端口等。
1.2 體育用品客戶消費行為特征提取
考慮到每個客戶消費行為數據樣本中存在單一數據對應多個數據屬性的情況,如a11中可能包含消費主動性增強、消費個性回歸、客戶需求差異性等多維度屬性特征。在A中,這種具有多維屬性的數據項較容易出現局部特征數據丟失情況,進而導致整體數據樣本點的分布,偏移客戶消費行為分析空間。
對此,本文利用徑向基RBF核函數對A中的數據進行預處理,改變數據在低維空間中的線性不可分情況,將其映射到高維空間,強化映射消費行為數據之間的非線性關系[9],并通過核函數超參數來控制數據向量在高維特征空間的映射狀態,獲取消費行為特征域,實現消費行為特征提取。
基于RBF核函數提取A中任意客戶消費行為信息與對應標簽,并將其轉化為可映射的向量形式對其進行核映射處理:
RBF(,b)=" (1)
式中:RBF(,b)表示RBF核函數的映射輸出結果,表示單一客戶對應的行為向量與信息標簽b在高維體育用品客戶消費特征向量空間的內積;ε表示RBF核函數的超參數;0,0表示原始消費行為數據的樣本點;e表示歐拉數。
在空間映射后,根據ε參數值可控制客戶消費行為數據分布狀態,較大的ε參數會使映射后的數據分布更集中,即數據點比較稠密[10]。基于此,根據ε的大小對應計算高維空間中單一客戶對應與b的歐氏距離D(A′,b),定位包含明顯非線性關系的空間用戶消費行為特征域(特征域為包含體育用品客戶行為特征的高維空間區域):
D(,b)=" (2)
式中:D(,b)表示空間用戶消費行為特征域;m表示高維空間區域特征維度;m與b表示消費行為數據經過RBF核映射后的高維特征表示。
1.3 基于消費數據挖掘的體育用品客戶精細化定位
1.3.1 體育用品客戶消費畫像構建
為了直觀反映客戶針對體育用品所產生的消費行為,呈現體育用品客戶消費數據的關鍵特征信息,以D(,b)為消費數據基點[11],進行客戶消費數據特征分類:
式中:C(,b)表示特征分類函數;T表示客戶消費數據采樣時間周期;?表示卡方檢驗因子;δ1、δ2、δ3、δ4表示不同客戶消費數據特征類別,依次為消費金額、消費頻率、消費時間周期、消費狀態;1、1表示δ1中對應的消費行為數據樣本點;2、2表示δ2中對應的消費行為數據樣本點;3、3表示δ3中對應的消費行為數據樣本點;4、4表示δ4中對應的消費行為數據樣本點。
在獲取δ1、δ2、δ3、δ4的基礎上,基于式(3)的運算邏輯重構包含n個關聯客戶的多維度消費行為特征域,且需要確保每個關聯客戶特征信息采集均源于A=[a1,a2,a3,…,a15]集合[12]。在遍歷目標群中的全部客戶后,則將包含多維特征尺度信息的體育用品客戶消費畫像表示為:
式中:μ表示包含多維消費特征信息的體育用品客戶消費畫像;C′表示客戶消費畫像特征分類線;F(μ)表示客戶消費畫像多變函數;δ表示畫像的多維特征尺度參量;φ1、φ2、φ3、φ4均表示畫像中呈現的客戶對于體育用品的關鍵消費特征指標,依次對應購買體育用品的平均訂單金額、重復購買率、入會時間以及客戶會員狀態。
1.3.2 基于k-means聚類的體育用品客戶精細化定位
為了實現客戶群體的精細化定位,通常會基于客戶價值模型(RFM模型)中的核心指標衡量客戶價值和客戶的創收能力,以此定位客戶群體,制定針對化、個性化的體育用品營銷服務[13]。然而,在體育用品客戶價值分析中,客戶的消費行為可能會受到季節變化、賽事情況等因素影響,導致消費行為以及體現出的消費特征呈現較大差異。
因此,本文結合μ的特征變量,改進RFM模型中的指標結構,即選取φ1、φ2、φ3、φ4構建RFM模型。在定位客戶消費特征變量的基礎上,將φ1、φ2、φ3、φ4導入N中,對應突出樣本的特征信息,生成具有結構性特征信息的數據集N′。再利用k-means聚類算法對包含多個特征變量的N′進行聚類分析,細分體育用品客戶,實現體育用品客戶精細化定位[14,15]。在聚類分析過程中,聚類中心代表了某一類客戶的典型消費特征,聚類集合包含了不同簇,這些簇代表了不同的客戶群體。聚類分析過程如圖2所示。
通過圖2獲取細化體育用品客戶群體后,可根據不同客戶群體對應的消費行為特征與客戶價值制定個性化營銷策略,以此實現體育用品客戶精細化定位。
2 實驗分析
2.1 實驗環境搭建
為了驗證設計方法的實際應用效果,從某體育用品銷售企業的CRM系統、企業資源計劃(ERP)系統、銷售與訂單管理系統、客戶信息數據庫中隨機抽取該企業2022年1月1日至2023年1月1日的客戶消費記錄(記錄全面包含綜合銷售與客戶關系管理數據),所采集的數據記錄共140 000條,涉及了5 620名用戶的消費信息,銷售總額達130 470.3萬元(在數據缺失值、模糊值處理后,有效數據記錄為135 000條)。其中包含了φ1、φ2、φ3、φ4等關鍵消費特征指標數據,即購買體育用品的平均訂單金額、重復購買率、入會時間(該公司會員服務始于2015年5月)以及客戶會員狀態(會員等級由高至低為:鉆石卡、黃金卡、白銀卡)。
利用MATLAB R2022a平臺建立客戶細分仿真模型,對采集數據進行聚類分析,在仿真過程中設置聚類數為4(即將客戶細分為4類),最大迭代次數為12,初始化質心次數為10,初始質心選擇方法為k-means++初始化方法,以加速迭代過程的收斂,隨機狀態參數為42。
2.2 體育用品客戶細化測試
在仿真過程中,聚類數設置為4。此處根據關鍵消費特征指標數據與客戶群體價值之間的對應關系,定義4類客戶分別為A類客戶(核心客戶)、B類客戶(高價值客戶)、C類客戶(一般客戶)。這些客戶群體對應的關鍵消費特征指標數據屬性值的變化情況如表1所示。
基于表1呈現的對應關系,進行體育用品客戶細化測試,具體如表2所示:
由表2可知,在所采集的5 620名用戶范圍內,屬于A類客戶的體育用品客戶共985名,年度平均訂單金額總量為55 700.15萬元、復購率為87%,體育用品消費支持占比較高。同時,該類客戶入會時間較長,會員狀態為最高級別,整體客戶群體的黏性較大,對于企業內部的體育用品品牌忠誠度較高。屬于B類客戶的體育用品客戶共1 328名,年度平均訂單金額總量為49 700.15萬元,復購率為34%,消費金額較多,但整體體育用品消費支持占比不高。同時,該類客戶入會時間較長,會員狀態包括最高級別與中等級別,整體客戶群體的黏性較A類客戶小。而C類客戶多屬于沖動型消費人群、自我利益型消費人群,在體育用品優惠力度較大,宣傳力度較廣時會產生該類客戶,但整體流動性大,客戶黏性不高。由此可知,利用設計方法可以通過k-means聚類分析實現體育用品客戶精細化定位,且定位結果以消費特征指標為支撐,具有較強的可靠性。
2.3 體育用品客戶精細化定位精度分析
為了測試設計方法的應用穩定性,需要進行體育用品客戶精細化定位精度測試。而誤差平方和SSE作為衡量模型預測結果與實際觀測值之間差異程度的指標,在體育用品客戶精細化定位中可以用來評估模型在每次迭代后對目標客戶群體的定位精度。隨著迭代次數的增加,期望SSE的值逐漸減小,表明模型對目標客戶的定位越來越精準。如果SSE隨著迭代次數的增加而逐漸減小,說明模型的定位精度在不斷提高。
輪廓系數結合了聚類的凝聚度和分離度,用于評估聚類效果的好壞。在體育用品客戶精細化定位中,可以將目標客戶群體視為不同的聚類,通過計算輪廓系數來評估模型對目標客戶的聚類效果,從而間接評估定位精度。如果輪廓系數隨著迭代次數的增加而逐漸增大,說明模型對目標客戶的聚類效果越來越好,定位精度也在不斷提高。
因此,將誤差平方和(SSE)和輪廓系數作為評價指標,測試設計方法在12次迭代中的體育用品客戶精細化定位精度,具體測試結果如表3所示。
由表3可知,隨著迭代次數的增加,利用設計方法獲取的SSE值處于持續降低狀態,在第12次迭代時SSE值降低到最低值,整體數值由100.35降至87.92。而輪廓系數隨著迭代次數的增加,也呈現持續增長狀態,同樣在第12次迭代時達到最高值,由此可知,利用本文設計方法所產生的體育用品客戶精細化定位精度較高,整體細化定位過程較穩定。
2.4 精細化定位方法綜合性能分析
為了驗證本文設計方法的實際應用性能,引入文獻[4]、文獻[5]作為對比方法,并將不同方法在測試過程中產生的準確率、召回率、F1值、G值作為評價指標,分析精細化定位方法綜合性能,不同指標的具體計算過程為:
式中:R表示召回率;P表示準確率;TP表示真正例;FP表示假正例;TN表示真負例、FN表示假負例;G表示G-means值,即敏感度和特異度的幾何平均值。
不同精細化定位方法綜合性能分析結果如圖3所示。
由圖3可知,在測試過程中,利用設計方法產生的準確率為0.91,召回率為0.92,F1值為0.95,G值為0.91,性能指標數值結果均優于其他兩種方法,表明本文設計方法在所有樣本中,對客戶價值的預測準確性較高且能夠找到大部分具有不同價值屬性的目標客戶,在正負樣本不均衡的情況下也能保持較好的性能,精細化定位結果穩定性較強。
3 結論
綜上所述,本文設計的基于消費數據挖掘的體育用品客戶精細化定位方法能夠基于客戶消費數據高效、精準地對目標群體中的體育用品客戶類別進行細化定位,對體育用品銷售企業的營銷策略制定、企業產品推廣及發展規劃具有重要影響。本文基于體育用品客戶消費行為數據采集指標體系,分析體育用品客戶消費行為數據采集的整體邏輯,構建客戶消費行為數據樣本。在數據樣本中,通過空間特征域劃分,提取體育用品客戶消費行為特征。基于客戶消費畫像、k-means聚類分析等消費數據挖掘技術,實現體育用品客戶精細化定位。實驗結果表明,利用本文設計方法可以通過k-means聚類分析實現體育用品客戶精細化定位,定位精度較高,且定位結果以消費特征指標為支撐,具有較強的可靠性。同時,設計方法對客戶價值的預測準確性較高,能夠找到大部分具有不同價值屬性的目標客戶,在正負樣本不均衡的情況下也能保持較好的性能,精細化定位結果穩定性較強。
——————————
參考文獻:
〔1〕陳勤,唐明歡,吳寧.面向體育運動體征數據的兩方認證密鑰協商協議[J].計算機應用與軟件,2023, 40(05):338-344.
〔2〕陸啟迪,陳志祥,魏鑫,等.基于實時視頻感知的虛擬體育交互系統[J].計算機系統應用,2023,32(03):125-132.
〔3〕崔馨玥,趙勝川.考慮細化用戶群體的全自動駕駛汽車使用意愿[J].大連理工大學學報,2022,62(05):476-484.
〔4〕嚴明時,程志勇,孫靜,等.基于兩階段學習的多行為推薦[J].軟件學報,2024,35(05):2446-2465.
〔5〕陳江美,張文德.基于灰關聯分析和時空偏好特征的興趣點推薦算法[J].系統工程與電子技術,2022,44(06):1934-1941.
〔6〕張瀟,劉淵.結合用戶視角的知識圖注意力網絡推薦算法[J].計算機工程與應用,2023,59(17):123-131.
〔7〕吳澤玉,劉建橋,楊丹,等.基于層次分析法和雙目標規劃的應急物資供應鏈優化[J].物流技術,2023, 42(01):107-114.
〔8〕黃奇峰,李波,楊世海,等.基于理想物元可拓模型的電力客戶價值評價研究[J].數學的實踐與認識,2023,53(06):98-108.
〔9〕董琴,楊濤.基于RBF神經網絡的關聯數據一致性挖掘仿真[J].計算機仿真,2023,40(07):457-461.
〔10〕李端超,陳小龍,吳朝文,等.基于客戶畫像的多元化能源消費側數據安全實時監測[J].微型電腦應用,2023,39(02):93-96.
〔11〕尹玉芬.基于電力營銷的客戶畫像標簽建立及應用研究[J].現代科學儀器,2023,40(02):131-136.
〔12〕金吉瓊,居雷,張易,等.基于用戶畫像的卷煙消費者特征識別和價值評估[J].煙草科技,2023,56(01):105-112.
〔13〕楊雨晨,李濤,謝君臣,等.融合領域知識的藥店用戶畫像建模及應用[J].計算機系統應用,2023, 32(06):99-106.
〔14〕高云梅,張淑慧.基于信息檢索與K均值聚類的化工產品精準推薦算法研究[J].粘接,2023,50(03):132-135.
〔15〕郭星,許旺土,任沖.基于常旅客價值的高速鐵路客戶分類研究[J].鐵道運輸與經濟,2022,44(06):48-55.