999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Catboost算法的優惠券個性化投放

2018-12-18 11:09:24廣東工業大學劉嘉穗
電子世界 2018年23期
關鍵詞:特征用戶模型

廣東工業大學 劉嘉穗

優惠券投放是O2O消費模式的一種重要營銷手段,但隨機投放會給大多數用戶帶來無意義的攪擾,并且還會增加商家業務的營銷成本。因此,本文對真實的用戶歷史行為信息進行挖掘,并基于Catboost算法對用戶未來是否會核銷優惠券進行預測,進而個性化向用戶投放優惠券。Catboost是一種新型的梯度提升樹算法,相較于傳統算法,它具有更高的準確度,因此,可以更加準確地預測用戶將來的消費模式,進而為優惠券的個性化投放提供一種更為可靠的決策依據。

1.概述

在線上平臺消費的過程中,人們會留下如瀏覽、搜索、點擊、收藏、評論等一系列行為特征指標,并最終會產生購買與否的消費行為結果。國外著名電商巨頭亞馬遜,通過對用戶線上的這一系列行為特征和行為結果進行挖掘分析,得到用戶的喜好和購買規律,預測用戶的消費行為,以此為基礎,構建推薦系統對用戶進行個性化推薦。據調研,其推薦轉化率高達60%(Linden,G.,Smith,B.,York,J.,2003.Amazon.com recommendations:Item-to-item collaborative filtering.Internet Computing,IEEE 7,76-80)。國外視頻網站Netflix(Amatriain X,Basilico J.Netflix recommendations:beyond the 5 stars(part I)[J].Netflix Tech Blog,2012,6)和社交平臺Facebook(唐穎.巴克萊卡:Facebook廣告效果頗佳[J].國際品牌觀察,2012(8):110-111)也都基于自己平臺上的用戶行為日志,打造個性化商品推薦和廣告投放服務,在進一步增加公司利潤的同時,也有效地提升了用戶體驗和用戶粘性,實現用戶、商家共贏。

許多學者也結合機器學習方法對推薦系統進行研究,以進一步提升推薦效果。朱奕健等人以隨機森林為模型,基于電信業務數據,構建電信運營商外呼推薦系統,有效提高了外呼用戶的接受率(朱奕健,張正卿,黃一清,自瑞瑞,嚴建峰.基于隨機森林模型的電信運營商外呼推薦系統[J].計算機科學,2016(S2))。He X等(HE X,PAN J,JIN O,et al.Practical Lessons from Predicting Clicks on Ads at Facebook[C]//Eighth International Workshop on Data Mining for Online Advertising.ACM,2014:1-9)將梯度提升樹(GBDT)和邏輯回歸(LR)相結合,通過GBDT對特征進行非線性映射,并用LR進行訓練,以此提升廣告的點擊率預估,為廣告的個性化投放提供決策依據。O2O消費模式自然與數以億計的消費者相關,商戶平臺記錄著海量的用戶行為日志。本文通過分析用戶的歷史交互日志,從用戶、商戶、優惠券等多方面構造特征,并引入新型的梯度提升樹算法Catboost進行訓練,預測用戶將來是否會核銷優惠券。實驗表明,相較于傳統算法,Catboost具有更高的預測準確度,為優惠券的個性化投放提供了可靠的決策依據。

2.數據處理

2.1 數據描述

本文采用阿里巴巴天池大數據平臺的開放數據集,包含了用戶、商戶和優惠券三者在2016年1月1日至2016年6月30日的真實交互行為(https://tianchi.aliyun.com/datalab/dataSet.html?spm=5176.1000 73.0.0.36ed6fc1dn1mQN&dataId=59),每條消費記錄包含了用戶、商戶、優惠券、優惠率、用戶與商戶的距離、優惠券領取日期以及消費日期共7個字段。用戶的行為結果分為“使用優惠券進行消費(正樣本)”、“沒有領取優惠券進行消費(普通消費)”以及“領取了優惠券但沒有進行消費(負樣本)”。通過挖掘歷史行為記錄,對用戶在未來15天內是否會核銷優惠券進行預測。

2.2 特征構造

原始數據包含的信息較少,不足以表征用戶的消費行為習慣,同時原始數據也包含了大量的缺失值以及各種非數值型數據,不能直接用于模型的訓練。為此,我們對原始數據進行統計歸納,構造特征如表1所示。

表1 各類特征描述

表1分別包含用戶、商戶、優惠券、用戶-商戶四個維度的特征。用戶特征包括用戶的總消費次數、優惠券的領取和使用次數以及優惠券領取和使用的時間間隔統計等,反映的是用戶在此期間的消費行為表現。同樣,商店和消費券特征也僅反映商店和消費券自身的受歡迎程度。用戶-商店屬于交叉特征,反映的是用戶對商店的喜歡程度或是消費的可能性。

3.算法描述

化我們的損失函數并得到最終的強學習器,算法流程如圖1所示,訓練集為,損失函數,以及迭代次數M。

由上述算法流程我們可以很清楚地發現GBDT就是在函數空間中的梯度下降。我們首先求得損失函數關于F(x)的負梯度,隨后訓練基學習器去擬合負梯度并得到最優步長,最后將各步得到的基學習器相加,也即是不斷地減去梯度,進而得到最終的強學習器FM(x)。

3.1 GBDT

梯度提升決策樹(GBDT)(Jerome H Friedman.2001.Greedy function approximation:a gradient boosting machine.Annals of statistics(2001)1189-1232)是由Friedman提出的基于boosting框架的集成學習方法,它認為boosting在一些適當的損失函數中是一種優化算法。它的核心思想類似于梯度下降,通過在函數空間中迭代地選取基學習器(通常是決策樹)來指向損失函數的負梯度方向,進而優

圖1 GBDT算法流程

3.2 Catboost

Catboost(A.V.Dorogush,A.Gulin,G.Gusev,N.Kazeev,L.Ostroumova Prokhorenkova,and A.Vorobev.Fighting biases with dynamic boosting.arXiv preprint arXiv:1706.09516,2017)是Gradient Boosting的一種新型實現。正如上一節的算法流程所示,在傳統的GBDT的每一步迭代中,它都是基于相同的數據集求得損失函數對于當前模型的梯度,并基于該梯度來訓練得到基學習器,但這會導致逐點梯度估計偏差,從而使得最終學習到的模型過擬合。Catboost通過采用Ordered Boosting的方式對經典算法中梯度估計方式進行改變,進而獲得對梯度的無偏估計,以減輕梯度估計偏差的影響,提高模型的泛化能力,Ordered Boosting的算法流程如圖2所示。

圖2 Ordered Boosting流程

由上述流程可知,為了得到無偏梯度估計,Catboost對每一個樣本xi都會訓練一個單獨的模型Mi,模型Mi由使用不包含樣本xi的訓練集訓練得到。我們使用Mi來得到關于樣本的梯度估計,并使用該梯度來訓練基學習器并得到最終的模型。

3.3 評判指標

對于顧客是否會在指定時間內核銷優惠券,我們將其轉換為一二分類問題進行處理,并且我們重點關注模型的泛化性能力,所以我們采用ROC曲線下面積AUC來作為評判模型的指標。我們基于模型的預測結果對樣本進行排序,計算得到“真正例率”(True Positive Rate,TPR)和“假正例率”(False Positive Rate,FPR)并分別作為縱軸和橫軸從而得到ROC曲線,最終得到曲線下面積AUC。具體公式如下:

其中TP為正確預測的正樣本數,FP錯誤預測的負樣本數,TN為正確預測的負樣本數,FN為錯誤預測的正樣本數。

4.實驗結果

我們從時間維度上對原始數據進行滑窗劃分,以連續4個月作為一個窗口,一個月作為間隔,將前三個月作為特征數據,后一個月作為標簽數據,以此將原始數據分為3個數據集。我們使用前兩個數據集訓練模型,用第三個數據集來測試模型,得到模型的AUC并和傳統的GBDT和另一種著名實現Xgboost(T.Chen and C.Guestrin.Xgboost:A scalable tree boosting system.In Proceedings of the 22Nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,pages 785-794.ACM,2016)進行對比,ROC曲線和AUC結果如圖3和表2所示。

表2 AUC結果對比

圖3 ROC曲線

如結果所示,Catboost算法的AUC值都高于其它兩種算法,相較于其它兩種算法,Catboost具有更高的準確度和更強的泛化能力。

5.結語

本文采用新型梯度提升決策樹Catboost算法,并基于真實的客戶歷史行為信息構造用戶消費模型,預測用戶是否會在指定時間內核銷優惠券。實驗結果表明,Catboost具有更高的準確度和更好的的泛化能力,從而能更加準確地預測用戶將來的消費模式,進而為優惠券的個性化投放提供一種更為可靠的決策依據。

猜你喜歡
特征用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 72种姿势欧美久久久久大黄蕉| 亚洲精品国产成人7777| 一级毛片免费高清视频| 亚洲色欲色欲www网| 麻豆精品久久久久久久99蜜桃| 2021国产精品自产拍在线观看 | 中文字幕人成乱码熟女免费| 99激情网| 香蕉99国内自产自拍视频| 久久国产高清视频| 国产精品视频白浆免费视频| 午夜视频日本| 亚洲午夜久久久精品电影院| 国产在线观看精品| 青草91视频免费观看| 欧美亚洲欧美区| 真实国产乱子伦高清| 久久久91人妻无码精品蜜桃HD| 日韩亚洲高清一区二区| 性欧美在线| 99热免费在线| 91亚洲国产视频| 特级做a爰片毛片免费69| 亚洲av成人无码网站在线观看| 国内精品手机在线观看视频| 亚洲成人网在线播放| 综合色88| 国产成人乱无码视频| 成人日韩欧美| 国产成人免费视频精品一区二区| 久久久国产精品无码专区| 久久99国产综合精品女同| 在线观看免费人成视频色快速| 久久77777| 青青国产视频| 全部毛片免费看| 成人免费一区二区三区| 亚洲精品午夜天堂网页| 2021最新国产精品网站| 婷婷丁香色| 亚洲欧美综合在线观看| 最新国产成人剧情在线播放| 国产免费黄| 91免费观看视频| 日韩午夜伦| 婷婷五月在线视频| 色欲国产一区二区日韩欧美| 成人免费视频一区二区三区| 亚洲欧美日韩精品专区| 在线观看免费黄色网址| 久久黄色小视频| 2022国产无码在线| 天堂亚洲网| 中文字幕波多野不卡一区| 午夜性刺激在线观看免费| 亚洲一道AV无码午夜福利| 99re经典视频在线| 伊人狠狠丁香婷婷综合色| 456亚洲人成高清在线| 九九视频免费在线观看| 亚洲精品国偷自产在线91正片| 欧美成人一区午夜福利在线| 国产呦精品一区二区三区网站| 国产亚洲欧美在线人成aaaa| 福利视频一区| 女高中生自慰污污网站| 国产成人91精品免费网址在线| 日韩第一页在线| www.精品视频| 国产清纯在线一区二区WWW| 激情爆乳一区二区| 在线观看av永久| 国产91无毒不卡在线观看| 欧美一区福利| 国产91无码福利在线| 欧美在线综合视频| 亚洲免费成人网| 四虎在线高清无码| 午夜在线不卡| 性做久久久久久久免费看| 久久中文字幕av不卡一区二区| 中文字幕调教一区二区视频|