余自林,張曉龍
(1.武漢科技大學計算機科學與技術學院,湖北 武漢,430065;2. 武漢科技大學智能信息處理與實時工業系統湖北省重點實驗室,湖北 武漢,430065)
?
基于有效特征選擇的高價值移動通信用戶預測方法
余自林,張曉龍
(1.武漢科技大學計算機科學與技術學院,湖北 武漢,430065;2. 武漢科技大學智能信息處理與實時工業系統湖北省重點實驗室,湖北 武漢,430065)
高價值移動通信用戶預測是電信客戶關系管理中的一項重要內容。針對建立預測模型時遇到的高維、大規模、類不平衡等數據處理問題,提出了一種基于有效特征選擇的預測方法。利用欠采樣方式從初始不平衡數據集提取多個平衡訓練集,使用結合Pearson相關性分析和隨機森林特征重要性評估的特征選擇策略,在集成學習方法中嵌入加權和投票機制獲得最優的特征子集,最后采用隨機森林算法建立預測模型。實驗結果表明,該預測模型可以有效降低特征集的維度并提升對高價值移動通信用戶的預測性能。
移動通信用戶;不平衡數據集;特征選擇;Pearson相關分析;隨機森林;預測模型
隨著“互聯網+”商業模式的快速推廣以及4G通信市場競爭的全面展開,如何識別并發展高價值用戶是移動通信企業能否增加利潤并提高市場競爭力的關鍵。目前對高價值電信用戶的定義并無統一標準,相關學術研究集中于用戶細分[1-3]和流失預警[4-5]等方面,對用戶預測類的研究相對較少,因此根據客戶消費記錄和流失數據建立高價值移動通信用戶的預測模型具有重要的應用價值?!?br>