999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Catboost算法的優惠券個性化投放

2018-12-18 11:09:24廣東工業大學劉嘉穗
電子世界 2018年23期
關鍵詞:特征用戶模型

廣東工業大學 劉嘉穗

優惠券投放是O2O消費模式的一種重要營銷手段,但隨機投放會給大多數用戶帶來無意義的攪擾,并且還會增加商家業務的營銷成本。因此,本文對真實的用戶歷史行為信息進行挖掘,并基于Catboost算法對用戶未來是否會核銷優惠券進行預測,進而個性化向用戶投放優惠券。Catboost是一種新型的梯度提升樹算法,相較于傳統算法,它具有更高的準確度,因此,可以更加準確地預測用戶將來的消費模式,進而為優惠券的個性化投放提供一種更為可靠的決策依據。

1.概述

在線上平臺消費的過程中,人們會留下如瀏覽、搜索、點擊、收藏、評論等一系列行為特征指標,并最終會產生購買與否的消費行為結果。國外著名電商巨頭亞馬遜,通過對用戶線上的這一系列行為特征和行為結果進行挖掘分析,得到用戶的喜好和購買規律,預測用戶的消費行為,以此為基礎,構建推薦系統對用戶進行個性化推薦。據調研,其推薦轉化率高達60%(Linden,G.,Smith,B.,York,J.,2003.Amazon.com recommendations:Item-to-item collaborative filtering.Internet Computing,IEEE 7,76-80)。國外視頻網站Netflix(Amatriain X,Basilico J.Netflix recommendations:beyond the 5 stars(part I)[J].Netflix Tech Blog,2012,6)和社交平臺Facebook(唐穎.巴克萊卡:Facebook廣告效果頗佳[J].國際品牌觀察,2012(8):110-111)也都基于自己平臺上的用戶行為日志,打造個性化商品推薦和廣告投放服務,在進一步增加公司利潤的同時,也有效地提升了用戶體驗和用戶粘性,實現用戶、商家共贏。

許多學者也結合機器學習方法對推薦系統進行研究,以進一步提升推薦效果。朱奕健等人以隨機森林為模型,基于電信業務數據,構建電信運營商外呼推薦系統,有效提高了外呼用戶的接受率(朱奕健,張正卿,黃一清,自瑞瑞,嚴建峰.基于隨機森林模型的電信運營商外呼推薦系統[J].計算機科學,2016(S2))。He X等(HE X,PAN J,JIN O,et al.Practical Lessons from Predicting Clicks on Ads at Facebook[C]//Eighth International Workshop on Data Mining for Online Advertising.ACM,2014:1-9)將梯度提升樹(GBDT)和邏輯回歸(LR)相結合,通過GBDT對特征進行非線性映射,并用LR進行訓練,以此提升廣告的點擊率預估,為廣告的個性化投放提供決策依據。O2O消費模式自然與數以億計的消費者相關,商戶平臺記錄著海量的用戶行為日志。本文通過分析用戶的歷史交互日志,從用戶、商戶、優惠券等多方面構造特征,并引入新型的梯度提升樹算法Catboost進行訓練,預測用戶將來是否會核銷優惠券。實驗表明,相較于傳統算法,Catboost具有更高的預測準確度,為優惠券的個性化投放提供了可靠的決策依據。

2.數據處理

2.1 數據描述

本文采用阿里巴巴天池大數據平臺的開放數據集,包含了用戶、商戶和優惠券三者在2016年1月1日至2016年6月30日的真實交互行為(https://tianchi.aliyun.com/datalab/dataSet.html?spm=5176.1000 73.0.0.36ed6fc1dn1mQN&dataId=59),每條消費記錄包含了用戶、商戶、優惠券、優惠率、用戶與商戶的距離、優惠券領取日期以及消費日期共7個字段。用戶的行為結果分為“使用優惠券進行消費(正樣本)”、“沒有領取優惠券進行消費(普通消費)”以及“領取了優惠券但沒有進行消費(負樣本)”。通過挖掘歷史行為記錄,對用戶在未來15天內是否會核銷優惠券進行預測。

2.2 特征構造

原始數據包含的信息較少,不足以表征用戶的消費行為習慣,同時原始數據也包含了大量的缺失值以及各種非數值型數據,不能直接用于模型的訓練。為此,我們對原始數據進行統計歸納,構造特征如表1所示。

表1 各類特征描述

表1分別包含用戶、商戶、優惠券、用戶-商戶四個維度的特征。用戶特征包括用戶的總消費次數、優惠券的領取和使用次數以及優惠券領取和使用的時間間隔統計等,反映的是用戶在此期間的消費行為表現。同樣,商店和消費券特征也僅反映商店和消費券自身的受歡迎程度。用戶-商店屬于交叉特征,反映的是用戶對商店的喜歡程度或是消費的可能性。

3.算法描述

化我們的損失函數并得到最終的強學習器,算法流程如圖1所示,訓練集為,損失函數,以及迭代次數M。

由上述算法流程我們可以很清楚地發現GBDT就是在函數空間中的梯度下降。我們首先求得損失函數關于F(x)的負梯度,隨后訓練基學習器去擬合負梯度并得到最優步長,最后將各步得到的基學習器相加,也即是不斷地減去梯度,進而得到最終的強學習器FM(x)。

3.1 GBDT

梯度提升決策樹(GBDT)(Jerome H Friedman.2001.Greedy function approximation:a gradient boosting machine.Annals of statistics(2001)1189-1232)是由Friedman提出的基于boosting框架的集成學習方法,它認為boosting在一些適當的損失函數中是一種優化算法。它的核心思想類似于梯度下降,通過在函數空間中迭代地選取基學習器(通常是決策樹)來指向損失函數的負梯度方向,進而優

圖1 GBDT算法流程

3.2 Catboost

Catboost(A.V.Dorogush,A.Gulin,G.Gusev,N.Kazeev,L.Ostroumova Prokhorenkova,and A.Vorobev.Fighting biases with dynamic boosting.arXiv preprint arXiv:1706.09516,2017)是Gradient Boosting的一種新型實現。正如上一節的算法流程所示,在傳統的GBDT的每一步迭代中,它都是基于相同的數據集求得損失函數對于當前模型的梯度,并基于該梯度來訓練得到基學習器,但這會導致逐點梯度估計偏差,從而使得最終學習到的模型過擬合。Catboost通過采用Ordered Boosting的方式對經典算法中梯度估計方式進行改變,進而獲得對梯度的無偏估計,以減輕梯度估計偏差的影響,提高模型的泛化能力,Ordered Boosting的算法流程如圖2所示。

圖2 Ordered Boosting流程

由上述流程可知,為了得到無偏梯度估計,Catboost對每一個樣本xi都會訓練一個單獨的模型Mi,模型Mi由使用不包含樣本xi的訓練集訓練得到。我們使用Mi來得到關于樣本的梯度估計,并使用該梯度來訓練基學習器并得到最終的模型。

3.3 評判指標

對于顧客是否會在指定時間內核銷優惠券,我們將其轉換為一二分類問題進行處理,并且我們重點關注模型的泛化性能力,所以我們采用ROC曲線下面積AUC來作為評判模型的指標。我們基于模型的預測結果對樣本進行排序,計算得到“真正例率”(True Positive Rate,TPR)和“假正例率”(False Positive Rate,FPR)并分別作為縱軸和橫軸從而得到ROC曲線,最終得到曲線下面積AUC。具體公式如下:

其中TP為正確預測的正樣本數,FP錯誤預測的負樣本數,TN為正確預測的負樣本數,FN為錯誤預測的正樣本數。

4.實驗結果

我們從時間維度上對原始數據進行滑窗劃分,以連續4個月作為一個窗口,一個月作為間隔,將前三個月作為特征數據,后一個月作為標簽數據,以此將原始數據分為3個數據集。我們使用前兩個數據集訓練模型,用第三個數據集來測試模型,得到模型的AUC并和傳統的GBDT和另一種著名實現Xgboost(T.Chen and C.Guestrin.Xgboost:A scalable tree boosting system.In Proceedings of the 22Nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,pages 785-794.ACM,2016)進行對比,ROC曲線和AUC結果如圖3和表2所示。

表2 AUC結果對比

圖3 ROC曲線

如結果所示,Catboost算法的AUC值都高于其它兩種算法,相較于其它兩種算法,Catboost具有更高的準確度和更強的泛化能力。

5.結語

本文采用新型梯度提升決策樹Catboost算法,并基于真實的客戶歷史行為信息構造用戶消費模型,預測用戶是否會在指定時間內核銷優惠券。實驗結果表明,Catboost具有更高的準確度和更好的的泛化能力,從而能更加準確地預測用戶將來的消費模式,進而為優惠券的個性化投放提供一種更為可靠的決策依據。

猜你喜歡
特征用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 91精品伊人久久大香线蕉| 国产精品一区在线麻豆| 在线观看国产黄色| 高清色本在线www| 免费99精品国产自在现线| 久久久精品无码一区二区三区| 999福利激情视频| 欧美性精品| 亚洲人精品亚洲人成在线| 91久久偷偷做嫩草影院精品| 国产激情第一页| 日韩久草视频| 国产三级毛片| 在线观看免费国产| 欧美国产日产一区二区| 992tv国产人成在线观看| 亚洲天堂自拍| a级毛片在线免费| 日韩福利在线视频| 日韩专区欧美| 天天色天天综合网| jizz在线观看| 91美女视频在线| 久久国产精品电影| 香蕉国产精品视频| 国产一区二区精品福利| 国产欧美日韩专区发布| 男女性午夜福利网站| 天天综合网色| 激情午夜婷婷| 日韩精品久久无码中文字幕色欲| 中文精品久久久久国产网址| 亚洲综合狠狠| 亚洲一级毛片在线观播放| 六月婷婷激情综合| 亚洲中久无码永久在线观看软件| 伊人久久精品无码麻豆精品| 99er这里只有精品| 日韩无码黄色网站| 日韩免费中文字幕| 97影院午夜在线观看视频| 午夜视频免费一区二区在线看| 拍国产真实乱人偷精品| 欧美午夜网| 91视频99| 中文字幕亚洲无线码一区女同| 午夜成人在线视频| 国产又大又粗又猛又爽的视频| 国产亚洲欧美日本一二三本道| 亚洲国产精品成人久久综合影院| 亚洲日韩Av中文字幕无码| 亚洲人成成无码网WWW| 69免费在线视频| 日日拍夜夜嗷嗷叫国产| 91欧美亚洲国产五月天| 国产精品亚洲五月天高清| 国产高清不卡视频| 欧美福利在线| 精品国产女同疯狂摩擦2| 欧美福利在线| 日韩a在线观看免费观看| 亚洲国产欧美目韩成人综合| 97亚洲色综久久精品| 日本在线视频免费| 无码一区中文字幕| 国产性猛交XXXX免费看| 国产精品成人免费综合| 成人在线观看不卡| 中国精品久久| 福利国产微拍广场一区视频在线| 中国黄色一级视频| 成人精品区| 久久精品女人天堂aaa| 欧美亚洲欧美| 国产91麻豆视频| 久久无码免费束人妻| 亚洲AⅤ综合在线欧美一区| 亚洲国产天堂久久九九九| 日韩黄色在线| 91年精品国产福利线观看久久| 免费看av在线网站网址| 另类重口100页在线播放|