王小菁
摘要:本篇文章通過對用戶畫像技術的定義、數據來源、數學模型和數據庫的構建、用戶行為分析以及用戶畫像的意義等方面展開介紹,旨在突出強調用戶畫像在大數據時代的重要性。用戶畫像以標簽的形式精準高效地分析用戶的基本信息、偏好數據等,實現了對海量用戶的分類以及構建虛擬化用戶,對企業的發展有直接且深刻的影響。
關鍵詞:用戶畫像 模型構建 用戶行為
中圖分類號:F274 文獻標識碼:A 文章編號:1009-5349(2018)14-0254-02
一、用戶畫像的定義
關于用戶畫像的定義不同的學者有不同的表述,比如學者劉海、張鵬、劉譯璟就提出:全方位、立體性地記錄消費者的數據就叫作用戶畫像[1]。丁偉、王題等學者又認為:個體用戶所有信息的集合,就是通過收集與分析用戶的屬性、社交、行為偏好等信息,然后綜合歸納用戶的信息用以勾勒用戶的輪廓。但其關鍵的含義都是趨向將用戶信息分為幾個類別然后分別轉換成簡短易懂的標簽去描繪用戶的特征、偏好等方面的輪廓[2]。抽象地去勾勒用戶特征,在實際應用中具象化,大大提高了企業的運轉效率。
二、用戶畫像數據的來源
用戶畫像是基于海量數據建立起來的標簽式虛擬用戶,針對其數據來源不同的學者有不同的看法,例如學者姜建武等人認為:籠統地看,用戶畫像的數據來源大概包括兩種類型:靜態的用戶基本數據(年齡、體重等)和動態的時間、地點、行為等數據(也稱為靜態信息本體和動態信息本體),同時動態信息本體隱藏在用戶行為之中,需要利用互聯網技術進行捕捉。[3]這也是筆者比較贊同的觀點,也就是將用戶畫像的數據來源概括為靜態的基本數據和動態的行為數據。
三、用戶畫像數學模型以及數據庫的構建
對于企業而言,傳統的經營模式不再能滿足他們的需要,僅僅依靠企業工作中留下的記錄遠遠不夠,同時在大數據背景下,網絡技術使得消費者的消費行為可以轉化為數據,這也成為支持企業的發展最重要的數據來源之一,所以企業有必要專門構建用戶畫像的數據庫。劉海等學者在4C理論的基礎上設計了SQL Server數據庫,并且運用數據庫語言E-R圖進行具體的設計。這類數據庫不僅能夠在企業內部共享使用,還能有效降低企業的各方面成本,提高企業的經營效益。劉海等學者最終設計的數據庫包括客戶的基本信息、關于記錄客戶登陸日志的三方面信息、客戶瀏覽日志的五個方面信息、客戶下的訂單的信息、訂單包含的產品信息這五個部分。這個數據庫全面囊括用戶的所有信息,五個部分缺一不可。用戶畫像的數據庫建立的意義在于方便企業內部查詢數據,及時獲取用戶的信息,從而實現企業的精準化營銷。
此外學者余孟杰還提出權重計算法,認為內容地址、行為類型、時間衰減,決定了權重模型是關鍵,權重值本身的二次建模是水到渠成的進階,他認為用戶畫像的核心在于對于用戶接觸點的理解,他認為接觸點直接決定了標簽信息。接觸點可以是網址,也可以是某個產品的特定功能界面[4],并且通過計算權重來確定標簽模型。并借助Jon kolko提出的標簽權重=衰減因子*行為權重*網址子權重這一公式來進行計算模型權重值[5]。
四、用戶畫像中的用戶行為分析
這部分內容學界中有很多學者已經做過相關研究,筆者在廣泛閱讀文獻的基礎上,認為學者李映坤在其碩士學位論文中的研究結果極具代表性。學者李映坤主要是通過用戶在打電話、發短信、上網、玩手機App這四個層面的數據,整理了20個指標對用戶進行分類比較。從而分析不同類別的用戶的行為特征、偏好等潛在的一些特點。同時他將這部分的研究分為兩個部分:大樣本聚類下的手機用戶行為分析和傳統小樣本聚類的游戲用戶分析。
在大樣本聚類分析中李映坤借助Hadoop偽分布集群對原始數據進行清理,整理出30380個用戶的行為數據,然后使用Mahout上的K-means算法,最終將人群分為五種類型,這五種用戶群的特點主要是:第一類人除了不愛發短信,打電話、上網、玩應用軟件都非常頻繁;第二類人愛打電話愛發短信愛上網,但是使用應用軟件的時間不多;第三類人對所有的功能都不經常使用;第四類人不經常打電話發短信,但在上網和使用應用軟件的時間很多;第五類人經常打電話發短信,尤其是打電話的時間特別長,同時他們也經常上網和使用應用軟件。經過對比這五類用戶群的行為特征,李映坤認為第一類人群很有可能是一批年輕的女白領,第二類人有可能是一些年長的知識分子,第三類人更像城市底層的廣大勞動者,第四類很可能是學生,第五類人群很可能是社會精英階層,平時業務繁忙。筆者對這一系列的推斷保留意見,有懷疑的部分也有贊成的部分。
在傳統小樣本聚類分析中,學者李映坤以天天酷跑為例,參考1142名玩家的數據,根據市場營銷理論得到這些用戶在R(近度)F(頻度)M(強度)三個指標上的取值,之后使用K-means聚類方法最終將人群劃分為六類。這六類人群的偏好程度以及響應的吸引策略是:第一類淺嘗輒止型(放棄治療),第二類累覺不愛型(善意提醒),第三類隔三差五型(簽到獎勵),第四類接二連三型(在線獎勵),第五類天天酷跑型(加大難度),第六類天昏地暗型(適當更新)。[6]根據不同的用戶群體制定不同的吸引策略是企業構建用戶畫像能夠獲得的成績。
五、用戶畫像的意義
用戶畫像的存在意義大概有以下幾個方面:
第一,準確識別和勾畫目標客戶。在眾多的數據處理工具中,用戶畫像是幫助企業定位目標客戶最有效的工具之一。用戶畫像源自真實客戶的特征,在一定程度上反映用戶訴求,從而為企業的設計方向指明道路,雖然用戶畫像是一種虛擬的、標簽化的客戶大類,但能夠準確代表產品的主要受眾和目標群體。區別于原始的僅僅依靠企業工作記錄,用戶畫像更多的是對用戶進行研究、對市場進行研究。郝勝宇認為:如果說傳統的客戶分析是認識了客戶,那么用戶畫像技術就是與客戶成為朋友。[7]
第二,從長遠意義來看,用戶畫像可以讓企業實時把握消費者的變化。市場在不斷變化,產品的生命周期也在不斷循環,目標客戶或者潛在客戶的年齡、需求等方面都在發生改變,面對這些無可避免的變動,用戶畫像就能很好地幫助企業預警。比如針對客戶年齡變動這一因素,企業就需要依靠用戶畫像去確定不同年齡層次的用戶的消費特征、行為偏向等,從而調整產品,擴大受眾范圍。
第三,借助用戶畫像實現精準化、個性化推送。用戶畫像將整個客戶群分成擁有不同特征的子群。在網絡技術的支撐下,企業可以通過郵箱、QQ、微信等第三方賬號向客戶進行有針對性的推薦,這樣做既節省成本,還能提高效率,并且不像諸如電話推銷、短信轟炸這種給用戶帶來困擾。當用戶畫像與網絡、大眾傳媒協同發展,個性化推薦將得到進一步的發展與應用。比如淘寶的“猜你喜歡”,點進去你會發現跟你平時搜索的商品非常接近,這也是一個double-win的項目,在方便用戶查找自己所需產品的同時,增加了商家的利潤。
參考文獻:
[1]劉海,張鵬,劉譯璟.為消費者畫像[J].銷售與市場:渠道版,2013(9):30-32.
[2]丁偉,王題,劉新海等.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(3):64-69.
[3]姜建武,李景文,陸妍玲等.基于用戶畫像的信息智能推送方法[J].微型機與應用,2016(23):86-89.
[4]余孟杰.產品研發中用戶畫像的數據模建——從具象到抽象[J].設計藝術研究,2014(6):60-64.
[5]Jon Kolko.交互設計沉思錄[M].方舟譯.北京:機械工業出版社,2012:67-68.
[6]李映坤.大數據背景下用戶畫像的統計方法實踐研究[D].首都經濟貿易大學,2016.
[7]郝勝宇,陳靜仁.大數據時代用戶畫像助力企業實現精準化營銷[J].中國集體經濟,2016(4):61-62.
責任編輯:于蕾