黎坤
不知道大家有沒有這樣的感覺:如果你在抖音里經常看游戲解說,系統(tǒng)就會給你推薦各類游戲解說視頻,電商也是如此,搜索了幾次“游戲手柄”,然后在主頁的推薦列表里就會出現大量的游戲手柄及其周邊設備的內容,而這也就是傳說中的“個性化推薦算法”。在當今這個信息爆炸的時代,如何從海量的信息中快速地過濾掉無用信息,篩選出用戶最感興趣的內容是當前亟待解決的問題之一,而目前來看,國內在智能推薦算法領域,字節(jié)跳動旗下的火山引擎無疑最具代表性。
火山引擎是字節(jié)跳動旗下的云服務平臺,把字節(jié)跳動快速發(fā)展過程中積累的增長方法、技術能力和工具,開放給外部企業(yè),提供云基礎、視頻與內容分發(fā)、大數據、人工智能、開發(fā)與運維等服務,幫助企業(yè)在數字化升級中實現持續(xù)增長,所以你可以簡單粗暴地將火山引擎和阿里云、華為云、AWS等云計算服務列為同一類型。
智能推薦平臺是火山引擎多個特色功能的其中之一,來源于字節(jié)跳動推薦中臺,有成百上千算法工程師專門在優(yōu)化推薦算法。從可靠性來看,火山引擎支撐著字節(jié)跳動旗下包括今日頭條、抖音、飛書等應用,結果是毋庸置疑的成熟,而且通過火山引擎對外輸出給B端客戶時,用的是跟抖音今日頭條同一套引擎和同一套架構。

以跨境電商為例,考慮到出海企業(yè)都要做本地化運營,不同國家或地區(qū)的用戶偏好非常大。同樣一個產品,賣給歐美用戶可能更注重品牌,賣給東南亞用戶可能更注重性價比,如果商家通過人工分類的方式來進行推薦,效率無疑會非常低,并且很難做到長時間的維系,但是通過智能推薦算法就能很好地解決精細化運營的問題。
而且海外買量和拉新的成本明顯比國內高,如果沒一個好的推薦算法為客戶匹配相關產品,可能他買一件就不會再回頭了,無法實現客戶留存和復購的目的。并且電商也同樣會遭遇“二八效應”,也就是店鋪里八成的流量都會被兩成的產品帶走,對中長尾商品和新品的友好度較低,智能推薦算法就能在保持熱度產品推薦力度的同時,適當增加新品的曝光度,提升用戶的新鮮感。
智能推薦功能其實有不少云服務供應商在做,除了火山引擎之外還有華為云、騰訊云、阿里云等。從操作邏輯來看,用戶需要先將用戶信息、商品信息和用戶行為接入到火山引擎之中,相對于其他云服務來說,火山引擎支持歷史/增量數據質量校驗,支持指標為數據統(tǒng)計信息、分布信息、拼接率統(tǒng)計、歸因率統(tǒng)計、業(yè)務指標統(tǒng)計,以及支持數據質量閾值配置與告警,靈活性很高。
推薦服務包含召回、排序、業(yè)務干預三個主要流程。首先是召回,通常分為基于內容召回、基于協(xié)同過濾召回、基于模型召回,也就是火山引擎在接入數據后會把相關的數據回收,為下一步排序做準備。一般情況下會同時使用多種召回方式,并通過加權整合結果,并配合業(yè)務規(guī)則對召回結果集進行篩選、去重等操作。
排序可以分為粗排、精排兩種類型。當排序候選集數量較大,比如達到數千甚至數萬條目時,通常先通過粗排,降低候選集數量,再通過精排進一步優(yōu)化候選集。
如果候選集數量不大時就可以直接使用精排。這個排序的方式可以自定義,也可以根據火山引擎的黑盒模型來自動排,以視頻內容為例,可以選擇評論率和點擊率的乘數作為系數,火山推薦服務排序策略支持粗排/精排分別配置,且均支持多路組合。
業(yè)務干預就是對結果集提出篩選、去重、打散、置頂、降權等干預需求,也就是可以按用戶的實際需求來自定義化。而推薦系統(tǒng)的最終效果要在實際落地應用里進行驗證,推薦系統(tǒng)常見的業(yè)務指標以電商為例,有CTR(點擊通過率)、CVR(轉化率)、GMV(成交金額)等,以內容為例就是CTR(點擊通過率)、閱讀時長、點贊率、收藏率、分享率、評論率等。一般客戶會使用AB實驗,也就是將流量按是否通過智能推薦區(qū)分來進行對比,火山引擎就支持自動AB實驗功能,不需要用戶單獨再創(chuàng)建實例來進行對比。
總體來說,火山引擎在開放性、行業(yè)定制、數據安全和隱私問題方面都有相關部署,在業(yè)內已算是相當成熟的方案。

AB對照測試是火山引擎的一大特點