唐穎
何為標簽?大家最能想到的傳統標簽就是在圖書管理,每本圖書背上貼的那些紙質標簽。比如ISBN817525766-0,這是國際標準書號;書口往往會敲上藍印圖章,標明該圖書的擁有單位;在圖書系統未完善的時候,書上更會貼上分類標簽,比如歷史、文學、科普、管理等等;其實書上自身的作者、版權、出版社、印刷日期等也可以看做是這本書的一類標簽。
到了互聯網時代,我們在訪問電商網站時都會有商品導航標簽,比如京東首頁左邊赫然在目的導航標簽,比如家電、手機、數碼、電腦、辦公、男裝、汽車、視頻、圖書等,在用戶帶有目標性的訪問網站時,能有效的引導用戶找到自己需要的商品。
其實這類互聯網公司會對我們也悄悄打上各類標簽,對我們進行“歸類整理”。傳統的基礎標簽:活躍、付費類標簽;社會屬性標簽:性別、年齡、收入、學歷、職業、居住地、消費能力、信用等級等;偏好標簽:業務偏好、內容偏好、圈子偏好、時段偏好等;生態或其他標簽:在電商網站、社交或游戲等平臺內的購買、瀏覽、游戲行為計算出的對于某類商品的傾向、對于某類非消耗商品的擁有情況(比如你是否買過電視機、電冰箱、微波爐等)、對于消耗商品的日常消耗程度(每月會吃掉多少飲料零食、洗衣粉、洗發水等)、對于游戲玩法的激進程度、對于某類游戲道具的擁有情況、對于社交的渴望、朋友群的社群屬性等等。
有點規模的互聯網公司都會構建自己的標簽平臺,用來更快捷、更精細的運營自己的用戶。常用的應用場景有如下幾塊:
1 精細化運營
傳統行業或互聯網早期的運營方式都比較粗放,如一到節假日都會搞買199元送100元、滿299立減99、滿500元砸金蛋等活動。這類互動對于用戶是無差別的,能起到很好的品牌效應,但無法達到最大的經濟效益,同時也無法滿足用戶真正的需求。用戶往往會被優惠吸引而盲目地購買自己并不需要的商品,活動結束后卻有隱隱的后悔。
千人千面是精細化運營的核心思想,或許你會有2個疑問:
(1)如何確定對于不用用戶的活動力度或形式,我們評定的依據是什么?
(2)在公開場合下如何做到給用戶不一樣的活動內容,用戶會不會對活動的公平性提出質疑?
對于互聯網線上運營活動而言,這些都不是障礙。通過“運氣”這個掩護,我們能將本來的隨機性替換成“偽隨機”。比如用戶參與活動砸個金蛋,能獲得一張某種商品的大力度優惠折扣券,用戶在驚喜之余一定會珍惜這次看此難得的折扣機會,同時折扣商品又是心儀已久的商品,那購買率一定大大上升。比如我們知道這個用戶是個準媽媽,以往的消費能力不錯,根據以往的消費記錄來看她都等于品牌有一定的要求,恰好她有過瀏覽嬰兒床商品的歷史,那這次對于她的最佳活動折扣商品就不言而喻了。同時這款高端品牌的商品的折扣行為是悄然無息的,不會給其他用戶有折扣過的印象,保護了該品牌日常的日常銷量。這里我們需要用到這位用戶的消費能力、品牌敏感、性別、生育、年齡、近期偏好等標簽。
2 數據分析
有了標簽系統后,做數據分析是一件輕松愉快的事,往往還能分析到數據背后的數據。比如:
2.1 用戶群體分析
我們能通過一組標簽篩選出目標用戶,然后分析出該目標用戶群體下的其他標簽的分布情況。比如我們選擇“注冊時間”在近2個月內、“累計充值”大于50000、“首周付費”大于5000、“性別”為女的高質量用戶,然后查看他們“30天內活躍天數”、參與“雙十一活動”的比率、“年齡段”、“收入”、“學歷”等社會標簽的組成情況。然后通過增加“30天內活躍天數”<5天的條件,再次篩選出最近不活躍的高質量用戶,查看他們歷史“偏好商品”的分布情況,可以很方便的對這類用戶進行召回或促活活動,通過上文提到的個性化活動,對他們分別推送不同的禮品折扣券。
2.2 單用戶畫像分析
單用戶畫像分析往往應用在客服服務上,在客服對某一用戶進行電話服務時,可以直接調出該用戶的畫像,可以很清晰的了解用戶的基本面貌,以及歷史行為特征等。那在處理客服事件時就可以做到快速響應并針對不同情況做出最優處理。當處理好該用戶的事件后,這類信息又可以回溯到標簽系統中,為用戶更新或打上新的標簽。
2.3 活動效果分析
進行活動效果分析的前提是標簽系統和業務系統事先進行過活動埋點的對接,對用戶的互動參與、付費、消耗(部分預充值的平臺可以區分充值和消耗行為,比如游戲、直播、閱讀、FM等平臺產品)等信息進行有效的采集。
之后即可以在系統中對每批次活動進行效果分析,分析活動周期內的用戶參率趨勢。同時用各類標簽對參與、付費、消耗交叉各類標簽進行效果分析,往往一類活動的策劃是針對某一類用戶群的,比如針對高付費用戶的活動,就可以將VIP登記或者充值分段標簽與參與、付費、消耗進行交叉,分析活動是否達到預期效果。
如果活動是進行灰度發布的,那我們可以將參與活動用戶與未參與活動的用戶的交叉標簽進行A/B test比對分析。也可以再拉出社會屬性標簽,分析參與活動的用戶的性別、年齡、收入、學歷等分布,并與其它活動的社會屬性分布進行對比分析。總之,各類效果分析能幫助對后續活動進行指導,形成有效的運營閉環。
3 業務監控
傳統的監控往往是對pv、uv、付費金額等進行波段判斷,通過驟降、掉零、緩慢下降等策略做出報警功能。但有很多業務問題是這類監控力所不能及的。我們來看看標簽系統能為我們帶來哪些意想不到的新一代監控方式。比如:
3.1 標簽流動監控
如圖,這是一組互斥的活躍類標簽,通過過往的數據,我們很輕易就能計算出這組標簽的常規轉換路徑。其實在上圖中可以再增加一種預測類標簽,在流失和不活躍之間增加預流失用戶,通過機器學習中的分類算法,可以對用戶的流失行為作出預測。對應到付費維度,通過近段時間的付費行為,可以獲得“頻繁付費”、“活躍付費”、“新付費”、“回流”、“付費沉默”、“無付費”用戶標簽,我們通用可以根據歷史數據得出期間的轉換關系。
4 對外服務
4.1 開放API
標簽系統的核心不在于自身的界面功能,而是數據查詢能力。公司的其他系統都有查詢此類數據的需求,比如廣告系統、平臺系統、問卷系統、推送系統、運營平臺、客服系統、風控系統等。一般的插敘接口主要分三大類:
(1)通過一系列的標簽組合條件,查詢符合條件的用戶數量,并返回該用戶群體的ID組
(2)通過1個用戶的ID,查詢該用戶的用戶畫像
(3)通過標簽組合條件或者用戶ID組,查詢該用戶群體的指定標簽分布情況
其中第1類接口需要考慮到大批量用戶ID的傳輸場景,一次放回幾百萬用戶ID都是經常的事,所以得考慮接口異步查詢或分頁查詢的場景。
第2類接口往往是有高頻次訪問場景的,特別對于平臺或風控系統,在每個用戶登錄或消費時,都可能調用該用戶的部分標簽信息,判斷是否有安全風險。所以這類標簽需要做高并發的支持。
第1、3類系統由于是組合條件的查詢,往往會消耗服務器集群大量的計算資源,需要充分優化查詢算法并做緩存。
我們總結了用戶標簽的種種應用場景,可以看到標簽在互聯網運營過程中扮演了重要的角色。如何找出有價值的標簽,以及如何讓標簽融入到公司運營的各個環節,并形成有效的閉環,是公司生存發展的關鍵所在。
【參考文獻】
[1]《大嘴巴漫談數據挖掘》,易向軍,電子工業出版社.
[2]《Data Mining:Concepts and Techniques Third Edition》,Jiawei Han/Micheline Kamber/Jian PeiMorgan Kaufmann,Morgan Kaufmann.endprint