999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多模型融合的電子商務客戶流失預測模型研究

2022-11-21 02:04:46馬文斌陳碩峰
無線互聯科技 2022年17期
關鍵詞:融合實驗方法

馬文斌,陳碩峰

(廣西財經學院 教務處,廣西 南寧 530007)

0 引言

隨著互聯網的進一步普及,網上購物已經成為人們購買產品和服務的一種更重要的方式。根據第48次《中國互聯網絡發展狀況統計報告》顯示,截至2021年6月,我國網民規模達10.11億,網絡零售成為消費新引擎,上半年交易規模達6.11萬億元。但是,電子商務客戶是典型的非契約客戶[1],其關系終止難以有效判斷,具有不確定性,流失率較高。

客戶是企業的核心競爭力,提高客戶留存率是保持其競爭力的有效途徑??蛻袅魇ьA測是客戶留存的重要手段,也是客戶管理關系的重要環節。如何建立預測精準的客戶流失預測模型是當前學術界和行業界關心的問題。

當前研究主要將客戶流失預測視為一種兩類分類問題,利用機器學習方法構建預測模型。根據使用方法的不同,主要分為以下兩方面。

一是基于統計學的預測方法。此類方法簡單高效,具有較好的可解釋性,如Pareto/NBD模型[2]、邏輯回歸[3]、貝葉斯分類器[4]等,但是其泛化能力較差。

二是基于人工智能的方法。支持向量機[5-8]、神經網絡[9-12]、隨機森林[13-14]等人工智能方法具有較好的泛化能力,進一步提高了客戶流失預測模型的分類能力。

借助先進的人工智能方法,上述客戶流失預測方面的研究取得了一定的進展,但在電子商務客戶流失預測方面的研究還不多,且多采用單個模型進行預測,對流失預測的識別能力有限。

為提高電子商務客戶流失預測的精確率,基于集成學習思想,提出一種融合多個模型的流失預測模型。該模型以多個準確率較高的分類方法為基分類器,以投票法為集成策略。實驗結果表明,相比單個預測模型,該模型具有更好的預測能力。

1 多模型融合的客戶流失預測模型

集成學習是機器學習中一個重要的研究方向,其基本結構是先構建多個基分類器,然后利用適當的組合策略將它們的結果進行整合,??色@得比單個分類器更好的泛化能力。為提高客戶流失預測的準確度,本文基于Bagging集成思想,選擇多個泛化能力強且存在差異性的模型進行融合,以期獲得更好的預測結果。模型結構圖如圖1所示。

圖1 模型結構

本文模型首先將電子商務客戶數據劃分為訓練集和測試集,然后利用隨機欠采樣方法對訓練集進行類別再平衡,獲得類別平衡的新訓練集,接著在平衡訓練集上學習多個基模型,最后利用投票法將所有基模型的輸出進行融合,形成最終的預測結果。

2 實驗結果與分析

2.1 數據預處理

客戶流失預測是在客戶的歷史行為數據上提取、選擇客戶特征,并運用分類預測算法建立預測模型,預測客戶未來的狀態。本文實驗所用的電信客戶行為數據來源于Kaggle網站,共有5 630個樣本,包含流失客戶948個,非流失客戶4 682個,兩類客戶的比例基本為1∶5,數據類別不平衡。原始數據共有18個特征,其中連續型特征13個,類別型特征5個,部分特征存在缺失值。通過填充缺失值、異常值處理、one-hot變換等數據預處理后,共取得34個可用特征。為便于評估預測模型性能,將數據隨機劃分為訓練集和測試集,其中訓練集占比80%,測試集占比20%。由于數據類別不平衡,文中實驗采用隨機欠采樣方法對訓練集進行類別平衡處理。

2.2 基準模型與參數設置

為評估本文方法的預測能力,實驗采用XGBoost、LightGBM和隨機森林3種泛化能力較強的方法作為本文方法的基模型,并與支持向量機、決策樹等5種方法一起作為對比的基準模型。8種基準算法的實現主要使用基于Python的機器學習框架Scikit-Learn,xgboost和lightgbm,數據預處理主要使用Pandas數據分析庫。5種方法的參數設置如表1所示。

表1 方法參數設置

2.3 評價指標

由于電子商務客戶數據是不平衡數據,因此準確率并不能作為不平衡數據分類性能的評估指標。實驗采用F1值、召回率(Recall)、精確率(Precision)作為客戶流失預測模型的性能評估指標。召回率表示被正確識別的流失客戶占實際流失客戶的比例,召回率越高,說明對流失客戶的預測越準確;精確率表示被正確識別的流失客戶占識別為流失客戶的比例;F1值是關于召回率、精確率的綜合指標,其值越大,代表模型的綜合分類能力越強。根據表1,召回率、精確率、F1值的計算公式如下:

(1)

(2)

(3)

表2 混淆矩陣

2.4 實驗結果

表3是各個方法的評價指標對比,由表中數據可知,本文方法在3個指標上均有較好的表現。在F1值、Precision上均取得最高值,比XGBoost等對比算法平均高出8.45%,9.22%;在Recall上,與XGBoost、LightGBM持平,高于其余6種方法??傮w而言,多模型融合后進一步提高了模型的預測能力,有助于企業對流失客戶做出更為精準的措施。

表3 評價指標對比

3 結語

客戶流失預測是一個不斷發展的問題,過去的研究成果解決了客戶流失預測領域的一些重要問題,但仍存在一些不足。例如面對復雜度較高的電子商務客戶流失數據,單個模型的預測能力有限,很難取得理想的預測結果。為此,本文基于Bagging思想,提出一種基于多模型融合的電子商務客戶流失預測模型,該模型通過集成多個分類準確度高、差異度高的單一模型的輸出結果,獲得更好的預測結果。實驗結果表明,與隨機森林等模型相比,該模型擁有更好的預測效果,有助于降低客戶流失率,提高企業的經濟效益。由于條件所限,未能在大規模數據上驗證文中提出的方法,下一步的研究中,搜集更大規模的數據用于分析預測大數據環境下的電子商務客戶流失問題。

猜你喜歡
融合實驗方法
記一次有趣的實驗
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
做個怪怪長實驗
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲A∨无码精品午夜在线观看| 国产乱人免费视频| 高清不卡一区二区三区香蕉| 无码乱人伦一区二区亚洲一| 99热这里只有精品在线播放| 成年人国产网站| 91娇喘视频| 制服丝袜一区二区三区在线| 国产无人区一区二区三区| 亚洲Av综合日韩精品久久久| 日韩毛片基地| 在线日本国产成人免费的| 在线国产毛片| 亚洲国产精品日韩av专区| 亚洲精品午夜无码电影网| 国产成人av一区二区三区| 99久久国产精品无码| 久久99精品久久久大学生| 最新国产成人剧情在线播放 | 国产精品美人久久久久久AV| 国产素人在线| 一级黄色欧美| 无码中字出轨中文人妻中文中| 日日碰狠狠添天天爽| 国产不卡一级毛片视频| 免费A∨中文乱码专区| 重口调教一区二区视频| 久久精品无码一区二区国产区| 国产拍揄自揄精品视频网站| 亚洲自拍另类| 国产成人精品亚洲日本对白优播| 亚洲欧美日韩天堂| 国产中文一区二区苍井空| 久久人搡人人玩人妻精品| 国产成人精品一区二区三在线观看| 亚洲精品无码抽插日韩| 亚洲欧美h| 亚洲一区二区无码视频| 国产微拍一区二区三区四区| 伊人91在线| 99精品在线看| 国产精品私拍99pans大尺度| 欧美第一页在线| 91精品在线视频观看| 乱人伦99久久| 日韩美女福利视频| 米奇精品一区二区三区| 国产精品久久久久婷婷五月| 99人体免费视频| av午夜福利一片免费看| 亚洲中文字幕久久无码精品A| 波多野结衣爽到高潮漏水大喷| 国内精自视频品线一二区| 无码免费视频| 亚洲天堂视频在线免费观看| 国产又色又爽又黄| 日韩精品无码免费一区二区三区 | 亚洲av无码牛牛影视在线二区| 亚洲美女AV免费一区| 激情视频综合网| 亚洲手机在线| 亚洲无码高清免费视频亚洲 | 亚洲第一区欧美国产综合| 日韩精品毛片| 夜精品a一区二区三区| 日本国产精品一区久久久| 免费看美女毛片| 18禁高潮出水呻吟娇喘蜜芽| 精品福利一区二区免费视频| 亚洲综合片| 日韩在线永久免费播放| 欧美日韩国产成人高清视频| 一本色道久久88亚洲综合| 九九九九热精品视频| 91亚洲免费| 91久久精品国产| 人妻少妇乱子伦精品无码专区毛片| 极品尤物av美乳在线观看| 99精品伊人久久久大香线蕉| 中文字幕亚洲专区第19页| 女人av社区男人的天堂| 欧美国产日韩一区二区三区精品影视|