蔣亞博
(湘潭大學公共管理學院,湖南 湘潭 411100)
有關用戶畫像的研究最早起源于交互設計領域,由庫珀定義了關于用戶畫像的最初概念,同時強調了數據真實性在用戶畫像研方向的重要意。R.M.Quintana用下述定義來描述何為用戶畫像:“一個具體的、清晰的形象集合,需要從海量數據中來獲取數據基礎,再由用戶信息層層構成”,可以通過利用這個集合,便捷、快速的分析出用戶需求、個性化偏好以及用戶興趣等相關內容。作為隨著技術進步發展越來越成熟的數據分析工具,用戶畫像可以從各個維度抽象出用戶的信息全貌,加以描繪并且記憶用戶需求變化并分析用戶需求變化的根本原因,從而進行精準的廣告營銷等其他相關應用范圍。余孟杰將用戶畫像定義為一種大數據環境下,對于用戶信息特征進行標簽化的方法。即首先由大數據提供足夠的數據基礎,隨后通過抽象提取出用戶信息特征,然后進行標簽化處理以求完美地呈現出用戶全貌,最終形成一個虛擬的用戶全貌,即為用戶畫像。隨著大數據的發展,用戶畫像也隨之外延拓展到了互聯網應用領域中,以海量的數據為基礎構建虛擬用戶的思路在不同的領域都得以應用。此外,企業“精準營銷”和“需求導向”等目標更是與用戶畫像的作用契合,促使越來越多的學者開始將研究點放在用戶畫像領域。用戶畫像可以被看作是基于用戶真實數據的虛擬代表,是具有相似行為、興趣、生活環境的用戶群體在使用某一產品或者服務時所呈現出的共同特征集合。用戶畫像最顯著的特征便是基于用戶群體構建的概念模型,當前國內外對用戶畫像的研究內容的側重點不同,總體而言分為三個部分:用戶屬性、用戶行為和用戶心理。
在國外IrisVilnai-Yavetz研究了facebook上用戶基礎數據,根據照片將500個隨機選擇的Facebook用戶進行細分,不僅區分了五種不同類型的用戶,還將這些類型與受眾特征,品牌參與度和facebook的使用情況和動機相關聯。Lindsay R.Duncan通過創作非虛構人物肖像來描繪導致興奮劑的因素,分析青少年運動員面臨著發起興奮劑的復雜的個人和社會壓力。Bruno Agard提出了一種用于用戶行為分析的通用數據挖掘方法,對來自加拿大運輸當局的數據進行了實驗,結果表明可以得出主要涉及規律性和日常模式的用戶旅行行為指標。
在國內,劉海利用衣服銷售數據中的身高這一細分因素進行挖掘,重構消費者的需求。曾鴻以新浪微博數據為基礎,運用大量數理統計的方法挖掘明星粉絲的用戶畫像,幫助企業全面了解自己的客戶。邱云飛針對傳統用戶建模難以處理復雜網絡關系,提出基于網絡結構和文本內容的群體畫像構建方法。王娜設計了基于用戶畫像的信息后組織系統,為提高用戶信息檢索的精度,為用戶提供更為精準化和個性化的信息服務。熊偉通過采集用戶信息并對用戶群體進行分類,基于LDA模型,提出了一種基于用戶畫像和內容的服務重定向方法。林燕霞使用主題模型文本挖掘出用戶感興趣的微博主題,構建微博各類群體的用戶畫像,分析用戶行為、態度并提出相應的網絡輿情治理建議、個性化服務、營銷策略。單曉紅以在線評論數據為基礎,從用戶信息屬性、酒店信息屬性和用戶評價信息屬性三個維度構建用戶畫像模型的概念模型,為酒店了解用戶需求,開展精準營銷提供決策依據。何黎對微博用戶的信息和關系數據進行決策樹分析、相關性分析和關聯規則來挖掘用戶特征。莫君蘭提出科研團隊畫像的概念,以此為科研團隊信息的標簽集。然后,以電子文獻庫、國家基金網、個人主頁等多個異構數據源為基礎,提出融合多源異構數據的團隊畫像構建方法,以D大學的某團隊為例,將科研團隊畫像可視化展現出來。董寧結合主題調查問卷和訪談,建立多維數據來源;關聯分析建立用戶標簽體系,繪制群組用戶畫像,以此構建圖書館實施精準服務體系。
通過總結上述內容,結合上述分析可以看出,用戶畫像技術可以十分深刻地應用在描述用戶的群體行為特征、屬性特征方面,同時在網絡輿情治理、廣告營銷和個性化服務等諸多領域也可以發揮非常重要的作用。隨著用戶畫像技術的飛速發展,新時代各個行業的產品開發方向、精細化營銷方式和廣泛的應用場景也會出現新的發展契機,同時加快消費者日常生活方式向著數字化轉變。無論是在日新月異的互聯網行業,還是在傳統消費行業,用戶畫像研究都展現出強大的滲透力和發展潛力。
目前國內外與用戶畫像相關的研究與實踐活動日趨頻繁,涉及的應用場景也日益廣泛。國內外用戶畫像研究涉及多個學科領域,主要包括計算機、圖書情報、應用心理學、智慧物流、管理科學與工程等領域,不同學科從不同角度進行了多維度的相關研究,提供了不同角度下的見解和豐富的成果以供學術界借鑒。國內外用戶畫像研究的技術方法多種多樣,在數據收集方面既有問卷、訪談等社會調查方法、又有基于平臺的網絡數據采集方法;在數據分析和數據建模方面,也涉及統計建模、數據挖掘、機器學習等各種方法。
對于與用戶畫像質量息息相關的數據質量和數據大小問題,首要任務是要優化獲取數據的方法,對數據挖掘方法加以拓展和改進。雖然利用現有方法已經可以大體上實現用戶屬性、用戶行為特征、用戶心理描述與表示,但在實際研究中,內容紛繁復雜和質量參差不齊的海量數據對于用戶畫像的研究方法提出了更高的要求。一方面,如何通過更有效益的方法來獲取高質量的數據是需要解決的問題,另一方面,如何更好地利用好海量的數據也是用戶畫像研究需關注的問題。另外,對于一些主題不易獲取數據的用戶畫像問題,常常面臨數據源數據的總量相對較小、數據質量不高、數據難以接觸等問題。對于此類研究主題在研究初始的獲取數據的方法選擇上面要做好準備,才能保證研究方法適用性的基礎條件。數據是整個用戶畫像研究的基礎,所有的用戶畫像維度都是從數據中衍生出來而來,所以數據的質量至關重要。在當前國內外學術界的用戶畫像研究中,涉及數據獲取渠道和數據類型具有多樣性,數據獲取渠道包括調查數據、網絡數據、平臺數據等,數據類型包括用戶屬性數據、用戶行為數據、用戶生成數據等;獲取數據的方式有的通過以訪談、問卷、調研為代表的社會調查方法收集數據,在數據獲取渠道和方式多元的情況下,不同類型的數據出現了獲取渠道大致相同的特征,相同類型的數據反而是獲取渠道不同的特征。我們需要將不同數據源、不同類型的數據進行整合之后再利用合適的技術方法提取標簽構建用戶畫像。實現數據融合與提升,就能夠構建更加多元、精準的用戶畫像。