王會娟



摘 要: 實時競價中,準確預測展示機會的中標價能有效指導代表廣告主利益的需求方平臺制定競價決策和分配廣告預算,從而優化廣告活動績效。目前的主流方法是在全部樣本上訓練單一預測模型,忽略了不同樣本之間的差異。論文提出了基于展示機會細分的中標價預測方法。根據展示機會對應的用戶、媒體、廣告特征,該方法首先通過聚類將展示機會的歷史競價記錄細分成多個子集,針對每個子集,分別訓練預測模型并進行合理組合,從而提升其預測性能。基于真實的實時競價數據進行仿真實驗,與主流方法進行對比分析,驗證了該方法的有效性。
關鍵詞: 中標價預測;展示機會細分;實時競價
中圖分類號:F 713.8
文獻標志碼: A
Abstract: In real-time bidding, predicting the winning price of an impression opportunity accurately can effectively guide the Demand-side Platform , which represents the advertisers benefits, to make the bidding decision and allocate advertising budget, so as to optimize the performance of advertising campaigns. The mainstream methods are to train a single prediction model on all data samples, ignoring the differences between different samples. A winning price prediction method based on impression opportunity segmentation is proposed. According to the user features, publisher features and advertising features of impression opportunities, the method divides the historical bidding records of impression opportunities into several subsets by clustering. The prediction models are trained respectively for each subset, and combined reasonably to improve the prediction performance. Simulation experiments on real-time bidding datasets and a comparative analysis with mainstream methods have verified the effectiveness of the proposed method.
Key words: winning price prediction; impression opportunity segmentation; real-time bidding
實時競價中的關鍵參與方包括廣告主(Advertiser)、媒體(Publisher)、用戶(User)、需求方平臺(Demand-Side Platform, DSP)、供應方平臺(Sell-Side Platform, SSP)、廣告交易平臺(Ad Exchange, Adx)以及數據管理平臺(Data management platform, DMP)等。SSP幫助媒體(廣告展示機會的擁有者,例如各種網站)出售廣告展示機會,DSP代表廣告主參與實時競價購買展示機會用于廣告投放。當網絡用戶訪問網頁時,網頁上的廣告位要展示的內容還未確定,SSP將此次展示機會及相關特征通過Adx發送給DSP,并發起競價請求;DSP根據展示機會的相關特征評估其對廣告主的價值并決定是否參與競價,如果參與,則將出價和廣告創意發送給Adx;Adx采用二價拍賣機制決定獲勝方,通知獲勝方支付費用,并將獲勝方的廣告投放到廣告位上;最終,用戶看到展示廣告。
實時競價中投放展示廣告按照展示付費,因此贏得展示機會來投放廣告需要付出成本,付出的成本就是贏得此次展示機會的中標價。廣告活動有預算約束,中標價作為贏得廣告展示機會的成本,是DSP代表廣告主制定競價決策時的重要影響因素。此外,中標價也能反映展示機會的市場價值以及市場競爭的激烈程度。因此,準確預測展示機會的中標價,能有效指導DSP制定競價策略和分配廣告預算。展示機會的中標價是歸并數據(censored data),現有研究大多是對數學模型進行改進,再使用全部訓練樣本訓練單一的預測模型。考慮到不同展示機會的價值差異,本文將具有相似特征的展示機會聚類,進行細粒度建模,并將子模型的預測結果合理組合,提升了預測效果。
1 文獻綜述
實時競價中展示機會的中標價預測通常是從DSP的角度,使用展示機會的歷史競價記錄訓練模型,預測新的展示機會的中標價或中標價分布。Ghosh等(2009)為了在給定預算下贏得一定數量的展示機會,假設每次展示機會的中標價是獨立同分布的,采用探索和利用的思路,先學習中標價分布,再根據得到的經驗分布進行出價。Li等(2014)認為為了以最低的成本獲取最匹配的廣告展示機會,需求方平臺必須準確估計中標率和中標價。他們首先用邏輯回歸模型對中標率進行建模,然后將中標率模型的導數作為中標價的分布,并計算中標價分布的期望值作為中標價的估計。以上研究是從數學模型的角度出發,沒有深入考慮展示機會的中標價與具體特征之間的關系。Wu等(2015)最早根據每次展示機會的數據特征直接預測其中標價。他們考慮到中標價是歸并數據,預測出每次參與競價的獲勝概率作為權重,將線性回歸模型和經典歸并回歸模型(Tobit模型)結合起來,實現了比線性回歸模型更好的預測效果。Tobit模型是基于正態假設的,Zhu等(2017)通過對中標價分布的觀察,使用伽馬分布代替正態分布,對歸并回歸模型進行改進。隨著深度學習的發展,Wu等(2018)提出一個通用的框架。在該框架下,可以假設中標價服從各種不同的分布進行建模,并采用深度學習方法求解參數。以上研究考慮到了數據特征對展示機會中標價的影響,但基于數據特征在全部樣本上建立單一中標價預測模型,使用單個權重衡量某個特征對所有樣本的影響有些片面。
實時競價過程中會產生海量數據,在全部樣本數據上訓練單個模型是粗粒度的建模,大量樣本共享同一個建模結果,難以保證預測效果。細粒度的建模通常能提升預測效果。Cui等(2011)研究了廣告活動中標價的分布。他們首先根據每個廣告活動的定向特征取值的不同組合,對展示機會的歷史記錄進行分類,在子數據集上實現細粒度的中標價分布估計,最后利用混合對數正態分布對細粒度的估計情況進行聚合,得到廣告活動的中標價分布。Lee等(2012)根據用戶、媒體和廣告等三方面不同層次的特征組合將數據分組,構建弱估計器,并使用邏輯回歸模型將弱估計器組合起來預測展示廣告的轉化率。潘書敏等(2017)根據用戶特征將廣告點擊記錄通過聚類劃分為多個子數據集,在每個子集上訓練邏輯回歸模型,將子模型的預測結果進行組合,提高了廣告點擊率預測效果。這種先通過分類或聚類將數據細分,再進行細粒度建模和預測的思路在其他領域也被廣泛應用。董毅等(2010)提出了基于支持向量機的先分類、再回歸的預測方法,在糧食產量預測中實現了很好的預測效果。夏利等(2014)提出了基于k均值聚類和支持向量機的先聚類再回歸的預測方法,并應用于機場噪聲預測,提升了預測精度。
在前人研究的基礎上,本文從DSP的角度進行中標價預測研究。在實時競價中,展示機會的中標價不僅受用戶特征影響,還受到媒體和廣告等方面特征的影響。本文以特征對展示機會中標價的影響為著眼點,根據用戶、媒體和廣告等方面的特征,使用聚類算法對展示機會進行細分,再在子數據集上進行細粒度的回歸模型訓練,最后將子模型的預測結果組合起來,提升了預測效果。
2 展示機會的中標價
歸并數據是指對于每一次觀測,都能觀測到解釋變量X的取值,但由于某些經濟機制或自然機制,有時能觀測到被解釋變量Y的取值,有時無法觀測Y的取值,只知道Y大于某個數或者小于某個數。由于數據的特殊性,常見的機器學習算法不適用于歸并數據,通常使用Tobit模型對歸并數據進行回歸和預測。
實時競價采用二價拍賣機制,參與競價的DSP若想贏得某次展示機會,需要預測競爭對手們的最高出價。對DSP而言,它的中標價(winning price)就是競價過程中競爭對手們的最高出價。對DSP而言,若在某次競價中獲勝,則贏得此次廣告展示機會,并支付中標價給媒體;若某次競價失敗,只能知道中標價大于等于自己的出價。因此,從DSP的角度看,展示機會的中標價是歸并數據。例如,在針對某次展示機會的競價中,共有A、B、C三家DSP參與。A、B、C的出價分別是50、100和150,那么A和B的中標價都是150,因為它們的競爭對手的最高出價是150。對C來說,中標價是100,因為它的競爭對手的最高出價是100。最終,C贏得展示機會,支付100給媒體;而A和B競價失敗,無法獲知競爭對手的最高出價,因此也不知道此次競價中自己的中標價。
2.1 真實中標價
本文借鑒Wu等(2015)對展示機會中標價的設定,在此進行簡要說明。假設在某次展示機會競價中,共有J家DSP參與,記作D1,… ,DJ。不失一般性地,本文站在D1的立場展開研究。表1是研究中涉及的變量及說明。
3 基于展示機會細分的中標價預測
3.1 模型構建思想
中標價預測是從DSP的角度,使用展示機會的歷史競價記錄訓練模型,預測新展示機會的中標價。每次展示機會都有用戶、媒體、廣告等方面的多個特征,展示機會的中標價與這些特征密切相關。用戶多、活躍度大的知名媒體廣告價值高,用戶少的媒體廣告價值低;消費能力強、興趣廣泛的用戶更可能點擊或購買,因此有更高的廣告價值。媒體和用戶的廣告價值越高,對應的展示機會的中標價也就越高。此外,展示機會對應的廣告位在媒體頁面上的位置越好,越容易引起用戶關注,中標價也就越高。在全部歷史競價記錄上,訓練單個預測模型是粗粒度的建模方法,忽略了不同用戶、不同媒體、不同廣告間的價值差異,大量樣本共享同一個建模結果,模型的預測精度比較低。因此,應該根據特征相似性將歷史記錄細分成不同子集,實現細粒度的建模。
基于上述分析,本文的模型設計思路如圖1所示。對于歷史競價記錄,提取用戶、媒體、廣告等方面的特征,通過聚類進行展示機會細分,每個子數據集內部的展示機會相似性較大,不同子數據集中的展示機會差異性較大。在聚類得到的各子數據集上,分別訓練Tobit模型作為子預測模型。新的廣告展示機會到來時,使用各子模型預測其中標價,并計算新展示機會被劃分到各子數據集的概率作為權重,加權平均得到最終的預測結果。
由于展示機會的歷史競價記錄數據量大,包含的數據特征多,本文采用高斯混合模型刻畫歷史競價記錄的分布。使用高斯混合模型,將展示機會的歷史競價記錄根據用戶、媒體、廣告等方面的特征劃分為k個子數據集,在每個子集上,訓練一個Tobit模型作為子預測模型。對于新到來的展示機會,提取特征放入k個子預測模型中,得到k個中標價預測值。為了得到中標價預測的最終結果,需要將k個中標價預測值進行合理組合。通過聚類,同一個子數據集內部的展示機會相似度較大,不同子數據集中展示機會的差異較大。通過高斯混合模型聚類得到的k個子數據集各自對應一個混合成分,根據公式(9),可以計算新的展示機會由每個混合成分采樣生成的后驗概率,本文用這個后驗概率表示新的展示機會與每個子數據集中展示機會的相似度。在線性模型中,展示機會間的特征相似度越大,中標價越接近,因此不同子模型的預測結果在最終結果中所占比重取決于新展示機會與每個子數據集中展示機會的相似度。基于該假設,本文用計算的后驗概率作為權重,對k個中標價預測值進行加權平均,作為最終的預測結果。
4 實驗結果與分析
4.1 實驗數據及數據特征處理
4.1.1 實驗數據介紹
由于商業隱私,廣告實時競價方面的公開數據集很少。2013年,知名DSP廠商iPinYou發布了一批真實的實時競價數據,包含三個不同時期的展示機會歷史競價記錄、展示記錄、用戶點擊記錄和轉化記錄。每一條數據記錄有用戶、媒體、廣告等方面的多個特征。這是實時競價領域內較為權威的公開數據集,很多學者使用該數據集進行了相關研究。
iPinYou發布的競價數據中,第二時期數據(2013年6月6日至6月12日)包含的數據特征最為完整,因此本文實驗采用第二時期的數據。iPinYou是一家DSP,其競價數據集中的中標價是歸并數據,競價失敗的數據記錄觀測不到真實中標價,只能觀測到真實中標價的下界,即自己的出價。然而為了評估模型預測效果,本文需要用到測試數據集中每一條競價記錄的真實中標價。因此參考過往研究(Wu等,2015;Zhu等,2017),本文基于歷史競價記錄中所有的獲勝記錄,通過模擬出價生成一批數據記錄用于仿真實驗,具體過程如下:
(1)選取所有獲勝的歷史競價記錄,記作數據集W。
(2)將數據集W中每一條記錄的出價乘以縮放因子0.5,得到新的出價。
(3)將數據集W中每一條記錄新的出價與中標價對比,若新的出價大于中標價,標記為獲勝記錄,否則標記為失敗記錄。對每一條記錄進行處理,得到用來訓練模型和評估預測效果的仿真數據集。
4.1.2 數據特征處理
實驗使用的數據特征見表2,Hour表示該次競價發生于一天中哪個小時;Operationsystem是指用戶訪問媒體網站時使用的操作系統;Adslotwidth和Adslotheight表示廣告位的寬度和高度,各自取特定的幾個整數值,因此本文將這兩個特征看作離散型特征;UserTags是用戶標簽集合,每個標簽對應一個用戶特征,例如標簽“10063”代表“個人關注娛樂”,本文進行實驗前將UserTags字段劃分開,得到43個用戶特征;其余數據特征的含義詳見Liao等(2014)。
由于模型的訓練需要數值型數據作為輸入,因此需要將離散型特征轉化為數值型數據。對于除Domain之外的離散型特征,本文采用獨熱編碼進行處理。獨熱編碼是機器學習中常用的離散型特征處理方式,它能將有N種取值的離散型特征轉化為N維二進制特征。由于Domain這一離散型特征的可能取值過多,采用獨熱編碼處理會導致數據維度過高,給預測模型的訓練帶來困難,因此本文采用業界常用的頻數編碼方式對Domain字段進行處理。對Hour這一連續型特征,本文采用最大最小歸一化進行處理。
4.2 實驗設計與評估指標
為了評估本文方法的有效性,本文選取了中標價預測的兩種主流方法進行對照實驗,分別是Tobit模型以及Wu等(2015)提出的混合歸并回歸模型。實驗數據中包含5個廣告活動,分別屬于不同行業,因此本文對每個廣告活動分別進行模型訓練和評估。在線廣告競價相關研究中(Gummadi等,2011;Chen等,2011;Zhang等,2014),普遍假設每次展示機會的特征向量都是從同一個分布中獨立生成的。因此,針對每個廣告活動的仿真數據集,本文隨機抽取2/3作為訓練集,使用剩余的1/3作為測試集。實驗使用均方誤差MSE作為預測效果的評估指標,均方誤差是預測值和真實值對應誤差的平方和的均值。
本文所提出的基于展示機會細分的中標價預測方法在模型訓練階段確定聚類個數時,針對每個廣告活動的訓練數據集,以2到12作為聚類個數進行聚類,計算對應的貝葉斯信息準則BIC作為聚類效果的評價指標進行比較,選定每個廣告活動的聚類個數。
4.3 實驗結果與分析
4.3.1 中標價隨特征變化規律
本文以實驗數據中的廣告活動3386為例,說明中標價隨不同特征的變化規律。圖2展示了每個小時內展示機會中標價的平均值,7:00—23:00展示機會中標價的平均值明顯高于1:00—6:00。圖3展示了中標價平均值隨用戶特征的變化規律。對于同一個用戶特征而言,是否具有該特征會影響相應展示機會的中標價;對于不同用戶特征而言,具有不同用戶特征的展示機會的中標價平均值也不同。此外,當展示機會處于頁面第一屏(即頭版頭條)時,中標價的平均值為108.01,遠高于處于頁面其他位置時的中標價平均值75.79。以上結果表明展示機會的中標價受到特征取值的密切影響,因此根據特征對展示機會進行相似性劃分,在相似樣本集上進行訓練和預測,將有助于提高中標價預測的準確率。
4.3.2 不同方法的預測結果分析
表3展示了每個廣告活動對照實驗上三種方法預測的均方誤差以及本文方法相比于兩種對比方法的誤差降低百分比。其中,本文方法是指本文提出的基于展示機會細分的中標價預測方法,Mixed是指Wu等(2015)提出的混合歸并回歸模型。混合歸并回歸模型組合了線性回歸模型和Tobit模型的預測結果,其中訓練線性回歸模型只使用獲勝的歷史競價記錄,訓練Tobit模型使用全部歷史競價記錄。
從表3可知,在五個廣告活動的對照實驗上,本文方法都實現了最小的預測誤差。對每一組對照實驗上本文方法和兩種對比方法的預測結果進行配對樣本t檢驗,P值都為0,說明預測誤差的降低在統計學意義上是顯著的。混合歸并回歸模型的預測誤差最大,這是由于本文實驗使用的仿真數據集中競價失敗記錄占有一定比例,并且失敗記錄的中標價往往顯著高于獲勝記錄的中標價。本文方法在每組對照實驗上的預測效果都優于單一Tobit模型,這表明先對展示機會通過聚類進行細分,再在相似樣本集上訓練模型進行預測,能夠有效提升預測效果。
5 結語
實時競價是互聯網展示廣告主流的交易方式。從DSP的角度,預測展示機會的中標價作為每次參與競價的成本參考,對于設計更高效的競價策略、實現更好的廣告活動績效具有重要意義。本文考慮到特征的不同取值對展示機會中標價的影響,基于特征相似度將展示機會的歷史競價記錄聚類細分成多個子集,以Tobit模型為子模型,實現細粒度建模和預測,以此提升展示機會中標價的預測精度。實驗結果表明,本文方法相比于單一Tobit模型和混合歸并回歸模型實現了更好的預測效果。
參考文獻:
[1] GHOSH A, RUBINSTEIN B I P, VASSILVITSKII S, et al. Adaptive bidding for display advertising[C]// International Conference on World Wide Web. ACM, 2009: 251-260.
[2] LI X, GUAN D. Programmatic buying bidding strategies with win rate and winning price estimation in real time mobile advertising[C]// Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer International Publishing, 2014: 447-460.
[3] WU C H, YEH M Y, CHEN M S. Predicting winning price in real time bidding with censored data[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2015: 1305-1314.
[4] ZHU W Y, SHIH W Y, LEE Y H, et al. A gamma-based regression for winning price estimation in real-time bidding advertising[C]// 2017 IEEE International Conference on Big Data (Big Data). IEEE, 2017: 1610-1619.
[5] WU W, YEH M Y, CHEN M S. Deep censored learning of the winning price in the real time bidding [C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM, 2018: 2526-2535.
[6] CUI Y, ZHANG R, LI W, et al. Bid landscape forecasting in online ad exchange marketplace[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2011: 265-273.
[7] LEE K C, ORTEN B, DASDAN A, et al. Estimating conversion rate in display advertising from past performance data[C]// Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Ming. ACM, 2012: 768-776.
[8] 潘書敏, 顏娜, 謝瑾奎. 基于用戶相似度和特征分化的廣告點擊率預測研究[J]. 計算機科學, 2017, 44(2): 283-289.
[9] 董毅, 程偉, 張燕平,等. 基于SVM的先分類再回歸方法及其在產量預測中的應用[J]. 計算機應用, 2010, 30(9): 2310-2313.
[10] 夏利, 王建東, 張霞,等. 聚類再回歸方法在機場噪聲時間序列預測中的應用[J]. 數據采集與處理, 2014, 29(1): 152-156.
[11] 陳強. 高級計量經濟學及Stata應用[M]. 2版. 北京: 高等教育出版社, 2014: 239.
[12] 周志華. 機器學習[M]. 北京: 清華大學出版社, 2016: 206-211.
[13] LIAO H, PENG L, LIU Z, et al. IPinYou global RTB bidding algorithm competition dataset[J]. ACM, 2014.
[14] GUMMADI R, KEY P B, PROUTIERE A. Optimal bidding strategies in dynamic auctions with budget constraints[J]. IEEE, 2011: 588.
[15] CHEN Y, BERKHIN P, ANDERSON B, et al. Real-time bidding algorithms for performance-based display ad allocation[C]// Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Ming. ACM, 2011: 1307.
[16] ZHANG W, YUAN S, WANG J. Optimal real-time bidding for display advertising[C]// In Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2014: 1077-1086.