□文│許志強 徐瑾鈺
從工業視覺到計算機視覺、從人機交互到智能駕駛、從虛擬現實到物體自動識別、從智能解釋到遙感解譯,大數據正在像水電煤氣一樣持續為人類造福,并成為了信息基礎設施中不可或缺的重要一環。大數據環境下的智能互聯平臺,一方面可將具有海量、異構、多維、多尺度等特性的用戶數據從終端匯聚到云端并進行實時監測、分析和管理,另一方面無所不在、具備自我學習能力的終端又能不斷地從云端汲取智慧,如此正向循環,成就著“大數據”向“智數據”的過渡。
在整個世界都由算法控制的互聯網大數據時代,數據基于用戶行為而生,大數據通過“量化一切”實現了世界的數據化。基于大數據的思維和工具,使得人類不僅可更快地通過智能設備完成數據采集、沉淀與歸類等,還可得到用戶的各種畫像。這種變遷將對促進計算機與外部世界內容驅動和交互方式的演變,甚至對促進外部世界按照智能合約更加智慧的運行。
數字時代,大數據實現了從“數據→信息→知識→決策”的一整套數據到應用變現,[1]并從提供數據支持的低級階段進入到了擁有自身獨立產業鏈的高級階段。[2]站在哲學的高度理解,大數據既可以描述客觀物理世界,又可以刻畫人類精神世界和人類社會,是融合“人類社會(Human society)-信息空間(Cyberspace)-物理空間(Physical space)”三元世界的紐帶(見圖1)。[3]

圖1 大數據:三元世界的紐帶
數字時代,用戶數據(包括人口學特征、設備信息、商業屬性等相對穩定的靜態數據和訪問頻率與深度、停留時間、拖拽行為等實時變化的動態數據)直接或間接地反映出了用戶行為習慣和態度偏好。若能將用戶所有的數據快速歸類與聚合分析并進行標簽、權重與模型化處理,便能抽象出一個標簽化的用戶模型,即用戶畫像。
數字時代,傳統媒體“內容為王”的深度優勢不再,“渠道為王”“終端為王”的格局也難撐全局,而“以人為本”的設計理念得到了包括傳媒領域在內的各個領域的廣泛認可,使得“用戶為王”全面開啟了新時代。由此可見,大數據與用戶體驗亦為正向循環,大數據為優化用戶體驗提供了有力工具,用戶體驗則為解鎖大數據提供了密鑰。
研究發現,基于用戶行為數據的用戶模型呈現實時動態性。從訪客到陌生人到最后成為高凈值用戶,在構建用戶畫像生命周期的不同階段,傳媒業界或可采取有針對性的拉新、轉化、留存等運營策略。

圖2 基于數據驅動的用戶畫像生命周期
一般采用市場需求調查、產品/服務使用現狀等方式來研究計劃所屬領域的整體用戶屬性特征,明確定位用戶,并通過用戶的人口統計、社會屬性、用戶消費、用戶行為等基礎數據初步構建起用戶畫像,從而完成對海量用戶基本情況的調研。
一般采用用戶體驗、產品包裝與產品定價等方式來測試用戶與產品的匹配度。通過行為、用戶、資源維度逐層鉆取關聯分析得到更精準細化的(用戶或資源)群體或行為現象,對用戶觸點的理解是核心,解決標簽與算法分發權重是關鍵,如此方能構建出包括用戶標簽、時間、行為類型、接觸點(終端+內容)等信息在內的臨時用戶畫像模型。
一般采用人群特征、廣告創意、媒介選擇與引流獲客等受眾與渠道分析的方式發現并獲取潛在客戶、引導客戶使用新產品并培養高凈值客戶。通過以上綜合評估媒介質量及用戶的使用習慣助力廣告媒介的明智選擇,實現精準投放。
一般采用購買行為、售后服務與神秘客等用戶體驗與留存的方式來重新激活或延長既得用戶生命周期。通過對用戶畫像數字價值發現與應用不斷地由粗到細、由大變小的篩選、過濾、剔除不符合條件的數據結果集,并向用戶提供精確的服務指向,從而得到下一版本的用戶畫像的構建指標,如此循環、周而復始。
由此可見,消費不再是媒體流程的結束,一切數據匯聚到后臺用戶畫像重構,每一個數據升級又要求算法做出更高反饋,最終復原出一個個數字化的“完整人像”。從某種意義上講,人的思想、意識和行為方式,都可以通過數據的過濾及呈現,進行控制與干擾等。傳媒機構可借助用戶畫像生命周期管理的理念打通并優化價值鏈,總結出適合自身目標定位的營銷策劃思路,選擇一種或多種傳播策略以多樣化的形態競爭發展,最終在市場中立足扎根。
構建用戶畫像,應從用戶留在網絡上的“數字足跡”的采集、整理與歸類開始,在形成用戶的個性化標簽數據后,利用自然語言處理、機器學習、聚類分析等技術將業務廣泛且復雜多變的多維度用戶標簽融合為一體,再對其重要特征進行分析、理解和可視化,從而更精準地推斷出用戶真實需求(見圖3)。

圖3 用戶畫像構建流程
伴隨著信息技術從“計算”“連接”再到“智慧”的演進,傳播正在經歷從“簡單的傳播樹”到“密集的傳播森林”的進化。為更加精準地向用戶提供服務,傳媒機構可對用戶的海量數據及潛在信息進行最大程度的采集、整理、挖掘與分析,并用高度精煉的特征標識來描述用戶,從而構建出一整套完善的用戶畫像。抓取和分析用戶“數字足跡”,對用戶進行深淺度歸類,判斷其是否為活躍用戶或者忠誠用戶,并結合動態與靜態標簽從而構成完整的立體用戶畫像。以用智能設備播放視頻作為采集用戶多維屬性數據為例,如果只看圖4左側的動作列表便無法預測用戶將會做什么,因此還須知道如圖4右側所示的用戶基本屬性以及所處環境等并進行權重計算與分配。

圖4 組成用戶畫像的多維屬性數據
構建用戶畫像主要基于以下兩個規則:一是以解決實際問題為目的,即傳媒機構須結合自身性質,制定較明確的業務目標和推進能力;二是為進一步提升用戶體驗,即傳媒機構在對用戶基本屬性有極高認知的前提下,將滿足某種特定條件的用戶群體提取出來,然后分析這一群體的行為特征從而對新增業務進行優化設計。
在行為建模時,可在界定數據源和清洗數據之后采用“4W”模式(when、where、who、what)給用戶的行為標簽賦予權重,提煉關鍵要素。when(時間),指收集用戶時間因素(包含跨度和長度),即用戶某種行為發生、結束的時刻和用戶在特定頁面的瀏覽時間;where(地點),指收集用戶接觸點(內容和網址),即用戶作用于的對象標簽和用戶行為發生的具體地點;who(對象),指收集用戶標識因素(包括但不限于用戶名稱、電話、微信、身份證號、郵箱等),且不同標識的可信度不同;what(行為),指收集用戶事件因素(具象和抽象),即交互的商品/內容的標識和用戶的網絡行為。
由此可見,在內容展現與推薦過程中,當單個標簽權重確定下來后,便可利用公式計算總的用戶標簽權重:標簽權重=時間衰減因子×行為權重×接觸點權重。[4]傳媒業界可根據用戶行為進行畫像建模,在已有的用戶數據中深挖并貼“標簽”,刻畫出用戶的全網需求偏好模型,從而助推畫像與場景精準匹配的媒介技術升級。
傳統的非可視化技術需要專業統計人員提前對數據進行提取匯總,但這種方式制定的圖表屬于靜態性質,無法進行實時的動態調整。復雜廣泛的用戶數據,耗時耗力的匯集過程,終將導致傳媒機構無法滿足用戶的多元化需求,也無法達到產品優化的目的。因此,如何將廣泛復雜的用戶數據轉換成圖形或圖像并在屏幕上展現出來,則是數據可視化的關鍵所在。
目前傳媒機構大多利用計算機圖形圖像技術,聯系產品與用戶交互的理論技術,達到數據可視化的目的。在實現數據可視化過程中,涉及計算機圖形圖像、視覺以及輔助設計等多個領域,成為研究數據表示、決策分析等一系列問題的綜合技術。[5]傳媒機構在信息觸達環節中對用戶進行數據可視化分析,一方面能形象地展示用戶在某一接觸點的歷史行為數據(行為路徑、行為特征等)合集,另一方面能形象地展示用戶在各大網站上相互轉換與興趣偏好的數據合集。同時,還可根據用戶價值來細分出核心用戶、評估某一群體的潛在價值空間,從而提升信息和人的有效鏈接以及最大化的用戶體驗。
數字時代,新聞傳媒業面臨著智能化3.0轉型[6]與挖掘數據隱藏價值的雙重挑戰。媒體應從學理性思維和實踐性思維的雙重維度把握“媒介融合”,以內容、用戶數據和服務為核心資源,以多元智能終端為載體,從價值、連接、生態、體驗、創新等多個維度提升用戶體驗,從而促使大數據從“最大變量”發展成為未來媒介融合發展的“最大增量”,助推傳媒產業高質量發展。
在信息爆炸和消費升級的雙輪驅動下,可通過融合現實世界需求和虛擬分析空間的智能硬件自動采集客觀反映人口屬性、終端設備、用戶行為等多維度特征數據,深層剖析量化偏好程度、挖掘隱藏在背后的模式、趨勢和相關性,進行A(認知)、I(興趣)、P(購買)、L(忠誠)的全鏈路運營,從而推進用戶將“需求”轉變為“消費”。與此同時,為實現對用戶行為和事實的準確預測,還可運用新的數據分析技術和更完善的工具,將目標產品從面向海量廣泛的用戶市場轉換為個別用戶市場,從而提供精確、個性化的用戶服務。
例如,北京歌華有線除收集收視率數據外,還密切關注點播次數、回看次數、暫停等“隱形”數據,其在完整記錄用戶實際喜好的同時,通過精確“推薦”的方式為用戶提供個性化的智能電視收視服務,從而為節目制作、編排以及可能帶來的收視效果提供科學參考。
堅持以數據分析為導向,在充分了解用戶基本狀態屬性和歷史行為屬性等數據的基礎上,深入挖掘用戶行為、興趣和偏好等數據,并從多個觸點和時間段的大數據分析中找到關鍵點推動客戶最終完成購買,使用戶連接從過去的“經驗主義”的模糊方式邁向“數據驅動”的精確方式。在此基礎之上,傳媒機構可采取分流分級的方法實現對不同類型用戶的管理。對潛在用戶,通過對代表性常規屬性以及行為屬性數據的挖掘,提供針對性的服務將其轉化為正式用戶;對既得用戶,通過可行性測試觀察用戶如何使用產品,尤其是使用過程中遇到的問題及原因進而不斷迭代產品,從而提高用戶的滿意度、忠誠度,降低用戶的使用成本。
用戶原始數據類型復雜、數量繁多,其價值更是不可估量。為確保可為用戶提供精確、個性化的服務,各個細分行業須圍繞數字化關鍵技術、能力和基礎設施等不斷進行突破。為此,傳媒機構應盡快構建一種從數據存儲、數據集成、數據處理到數據分析以及數據可視化,相互依存、共同演化的“點—線—面—體”完整生態體系。該體系以大數據戰略和架構為基礎,除可隨時采集用戶實時數據與輕松瀏覽外,還可打開過去用戶數據中的封閉結構,并通過降維攻擊對產品功能進行更新升級從而高效地“連接”用戶,推動快速實現價值(失敗或成功)。
在產品生命周期的各個階段,包括調研、研發、營銷和售后等,數據導向戰略均發揮著重要作用。通過對潛在或既得用戶的大量行為數據的深度挖掘,可推動建立基于內容和用戶畫像的個性化推薦系統,從而為用戶提供更準確的搜索結果、更優質的搜索體驗。為優化用戶選擇最佳的收貨地點,零售門店可提供任何地方購買、挑選或發運的能力,使用戶感受到優質的服務體驗;為更好地了解店內客流量以及更適當的人員配備要求,可利用傳感器數據實時采集和分析入店率以及顧客消費情況等。
例如,零售巨頭沃爾瑪推出了一款針對購物的語義搜索引擎“Polaris”,其具備語義數據、文本分析、機器學習和同義詞挖掘等的能力,可對Polaris上的數據進行挖掘和分析,從而構建畫像并預測用戶的行為。銷售部人員通過用戶在Polaris上的日常商品搜索數據統計了解當季最新最熱產品,網站前端負責者則通過用戶反饋不斷完善網站類各板塊屬性,此舉幫其在線購物的完成率提升了15%左右。
構建用戶畫像是為用戶提供廣泛的個性化推薦,從而提升用戶體驗的有效手段。在個性化推薦技術中,算法分發權重(編輯分發、社交分發、各種算法產出等)是個性化推薦質量的良好保證,而用戶數據模型的質量好壞意味著能否正確表示用戶的興趣愛好。媒介融合環境下,基于內容的個性化推薦算法可提取用戶的時空多維屬性數據信息,融合線上與線下、融合現實與虛擬,實現“用戶、場景、創意”在媒介融合環境下的精準傳播,而這極有可能是一個涉及綜合賦能iABCD(物聯網、人工智能、區塊鏈、云計算、大數據)等新興科技的過程。[7]
在建構具體的算法模型時,可借鑒“M-P神經元模型”(McCulloch and Pitts,1943),如圖5所示。在傳媒領域,用戶行為便是神經網絡中的最基本元素——神經元。該模型中,數據中心在接收到來自n個維度、具有自學習和自適應的能力的用戶數據后,將接收到的所有數據互連、加權、累加,從而在不斷傳遞的過程中形成一定數量的經驗值,而所有經驗值在整合后又可與數據中心的閾值進行比較,然后通過“激活函數”(Activation Function)向外輸出優化建議[8](其中θ是所謂的“閾值”,f就是激活函數)。用戶數據經過此流程,層層篩選過濾,則可最終輸出代表著該用戶的完整畫像V值,此舉可為傳媒機構精準化服務提供決策支撐。

圖5 “M-P神經元算法”模型圖示
伴隨著區塊鏈、大數據智能分析等關鍵技術的交融發展,智能世界源于萬物的感知被喚醒并助推千億級別連接升級,鏈接將會增多變強并從不可信的“人-人”社交網絡向高度可信、跨界融合的“人-機-物”復雜社交網絡演進。本文首先從基于數據驅動的用戶畫像、用戶體驗及生命周期管理思想進行了探討,然后根據現有環境以及技術,從深挖價值、增強黏性、引導連接、聯網戰略以及提升體驗五個維度對用戶體驗的優化設計提出相應完善改進策略。
由于用戶數據存在部分空缺,本文對用戶的微觀行為刻畫比較有限,更多的是闡述了一種探析思路。今后,筆者將會以更多新算法技術與用戶畫像構建相結合的方式,獲取更準確的用戶行為和興趣偏好,從而為媒介深度融合探索全路徑,推進傳媒產業高質量發展。