肖 進,劉瀟瀟,謝 玲,劉敦虎,黃 靜
(1.四川大學商學院,四川 成都 610064;2.成都信息工程學院管理學院,四川 成都 610225; 3.四川大學公共管理學院,四川 成都 610064)
隨著大數據時代的來臨,企業掌握的客戶數據越來越多,一些企業開始利用數據庫營銷(Database Marketing)來避免傳統營銷中存在的低效率,高成本等弊端,用以從海量客戶數據中快速挖掘出客戶多樣化和個性化的需求。作為數據庫營銷中最重要的問題之一,目標客戶選擇建模用于從潛在客戶中識別出企業的目標客戶,即對企業營銷手段最可能做出響應的客戶,從而幫助企業制定營銷戰略。
目標客戶選擇建模實質上是屬于客戶分類的范疇[1],即將客戶分為兩類:對企業產品的營銷宣傳活動(如發送郵件或者短信等)做出響應,進而購買產品的客戶和不響應的客戶。目前,常用的目標客戶選擇模型主要包括人工神經網絡[2](Artificial Neural Networks, ANN)、遺傳算法[3](Genetic Algorithm,GA)、數據分組處理(Group Method of Data Handling,GMDH)神經元網絡[4]和支持向量機[5-6](Support Vector Machine, SVM)等。許多現實的客戶數據的類別分布往往是高度不平衡的,即會對企業的營銷活動做出響應的客戶比不響應的客戶少很多[7]。在這種情況下,上述傳統的分類模型可能會將所有的客戶預測為不響應的客戶,難以取得令人滿意的目標客戶選擇性能。為了解決這一問題,目前常用的方法是重抽樣技術(如隨機向上抽樣和隨機向下抽樣)來平衡訓練集的類別分布,再訓練分類模型。
上述研究對目標客戶選擇建模都做出了重要貢獻,但通過仔細分析,還存在以下不足:1)重抽樣技術存在缺陷。……