摘 要:目前客戶流失預測面臨的主要問題之一就是類不平衡性(class imbalance)。針對這個問題,首先應用欠抽樣法(undersampling)處理客戶流失數據降低不平衡性,再應用C4.5D、C4.5N、RⅡlPER、NaiveBayes和RandomForest機器學習方法對客戶流失進行預測。實驗結果表明,欠抽樣法是在犧牲負類樣本預測精度的前提下,提高正類預測精度,于是采用重復抽樣法(resampling)來彌補欠抽樣法的缺陷,減少負類樣本中含有大量有用信息的丟失,實驗結果證明了這種方法的正確性和有效性。關鍵詞:類不平衡性;客戶流失預測;機器學習;抽樣法