趙曉罡 副教授 王 越 耿紫珍 副教授 通訊作者
(西安外國語大學商學院 西安 710128)
本文選擇快時尚企業中具有代表性的ZARA和H&M,以其微博粉絲中的商業意見領袖為研究對象,構建用戶畫像模型,收集、分析在線用戶數據,比較ZARA和H&M微博商業意見領袖群體的用戶畫像差異,并提出結論與建議。
用戶畫像理論最早起源于美國,由Alan Cooper(1999)首次提出,他認為用戶畫像(persona)是一種從海量數據中獲取的、由用戶信息構成的形象集合。D Travis(2002)等將用戶畫像應用到電子商務領域,并從基本性、移情性、真實性、獨特性、目標性、數量和應用性七方面確定了用戶畫像模型的構成要素。隨后,相關學者補充了基本素養、學歷和社會關系等構成要素。
我國研究進程可分為3個階段。初始階段(2006~2009年):以魏士靖(2006)等為代表的學者,研究集中在用戶行為分析方法和手段、數據挖掘技術應用;起步階段(2010~2014年):鄭寶鑫、周雪松(2010)等正式提出基于我國用戶特點的用戶畫像模型,指出了推動大數據發展的重要性。發展階段(2015年至今):2015年國務院印發的《促進大數據發展行動綱要》,針對推動大數據的發展和應用提出了新要求。劉海、盧慧等(2015)從營銷學角度構建了基于用戶畫像挖掘的精準營銷細分模型。學者開始關注如何加強用戶的在線數據分析和推廣個性化精準服務。
目前,用戶畫像模型的應用研究最廣泛的是圖書館學和情報學領域。盡管學術界對用戶畫像模型構建沒有統一的標準,但建模思想具有相對一致性。張鈞(2017)等為代表的學者從用戶的年齡、性別等基礎信息、行為和心理特征以及社會網絡等方面構建用戶畫像模型,并根據行業特性進行適應性調整,如增加用戶活躍度等要素。
社交網絡媒體起源于美國,Twitter和Facebook是全球應用最廣泛的媒體平臺,也是學術界的重點研究對象。Peluchette(2008)指出不同性別的Facebook用戶具有不同的信息獲取傾向,Quinn等(2011)發現用戶年齡差異會影響使用社交媒體的行為,包括好友數量及功能使用。
社交網絡用戶及社群影響力已成為我國相關研究的熱點方向。仲兆滿(2017)認為微博用戶的興趣可從自填標簽、簡介等背景信息和用戶發文內容等獲得。劉玲(2017)提出了用戶影響力可從“用戶質量指數”進行構建,該研究加入了對用戶質量的考量,分析結果更具合理性和真實性,為本研究提供了有力支持。
綜上,本文采用融合用戶興趣的畫像模型,增加用戶影響力指標,旨在幫助企業更好地識別和了解社交網絡中的商業意見領袖,實現精準的網絡社群營銷。
用戶畫像也稱為用戶角色,是基于一系列真實數據建立的目標用戶模型,同時也是能描述如年齡、性別、居住地、工作地點等用戶特征的形象集合。本文采用融合用戶興趣的畫像模型構建方法,所構建的社交網絡商業意見領袖的用戶畫像模型包括兩類標簽,分別是基礎標簽和興趣標簽,如圖1所示。除基礎標簽和興趣標簽外,考慮到用戶影響力比較分析能反映企業營銷活動中商業意見領袖用戶畫像差異的原因,本文接下來將分別從基礎標簽、興趣標簽、用戶影響力三方面針對社交網絡商業意見領袖的用戶畫像進行數據收集、比較和差異原因分析。
行業報告顯示,在快時尚行業中,ZARA和H&M的品牌定位高度相似,品牌影響力位居前兩位,截止至2019年3月,ZARA和H&M官方微博粉絲數分別為850552人、898486人,為保障數據質量,選取其中更具代表性和影響力的社交網絡商業意見領袖作為研究對象。
依據微博官方對社群主題的劃分結果,選定其中人數占比且與服裝相關度均最高的三類商業意見領袖用戶,即時尚、美妝和娛樂明星類。根據占比值(依次為28.40%、13.52%和7.12%),分別在品牌粉絲群體中選取樣本758個(其他類型均小于2%,代表性不足不予選取)。其中包括關注ZARA微博的時尚類商業意見領袖237名、美妝類106名、娛樂明星類33名;關注H&M微博的時尚類商業意見領袖202名、美妝類103名、娛樂明星類77名。
本文通過網絡爬蟲技術,共計抓取758位商業意見領袖于2019年12月發布的全部微博文139917條。經數據去重篩選后,剔除掉無效商業意見領袖1位,重復和無效博文17663條,剩余總文字量達18963948字。
1.商業意見領袖個人信息。搜集到全部757位商業意見領袖的個人信息包括昵稱、所在地、性別、生日、簡介、注冊時間、標簽、認證、關注數、粉絲數和全部微博數。
2.商業意見領袖博文內容。共抓取757位商業意見領袖于2019年12月發布的全部發文信息122254條,以及每條微博的點贊數、轉發數、評論數、發表時間、被轉發理由、是否為原創內容、是否帶有圖片視頻。
基礎標簽數據采用描述性統計方法分析,興趣標簽數據則采用語義分析。基于抓取到的ZARA和H&M的文本數據,利用ROST NEWS ANALYSIS軟件對文本數據進行語義分析,包括文本預處理、詞頻統計和分類聚類分析,從基礎標簽、興趣標簽、用戶影響力三個方面研究ZARA和H&M微博商業意見領袖群體的用戶畫像差異。
1.性別。ZARA和H&M的三個類型商業意見領袖均以女性居多,占比在60.29%~88.68%之間。但相比H&M,ZARA的男性商業意見領袖占比均較低,兩者的占比差值在5%~10%之間。

圖1 微博商業意見領袖的用戶畫像模型

圖2 三類社群的興趣詞集表
2.年齡。從年齡分布上來看,80%的ZARA和76%的H&M商業意見領袖年齡集中在21~40歲間。21~30歲用戶群體比例ZARA為67%,明顯高于H&M的52%;31歲以上ZARA為17%,明顯低于H&M的30%,說明H&M商業意見領袖年齡大于ZARA。
3.所在地。總體來看,兩個品牌間用戶的所在地差距并無明顯差距,主要集中在北京、上海、廣東和海外地區。而從社群類型來看,ZARA時尚類的所在地以上海和海外地區為主,占比各為19%,而H&M占比最高的城市為北京和上海,各占21%。兩品牌美妝類的所在地占比最高的城市均為上海,比例為29%~30%。兩品牌娛樂明星類占比最高的城市均為北京,但所占比例差距較大,ZARA為46%,H&M為26%。
4.微博注冊時長。微博注冊時長是指商業意見領袖的微博注冊日期到2019年4月的時長。所有商業意見領袖的注冊時長均集中在7~9年,即均屬于較成熟的商業意見領袖,微博運營經驗豐富。
本文利用ROST News Analysis Tools工具對所爬取的用戶自我簡介、自填標簽、認證信息和微博文四類文本內容分別進行語義分析。由于博文文本中前60位特征詞出現頻次占總數量60%以上,其它近10萬特征詞出現頻次僅占總數的近40%,不具有研究價值,故選取前60位特征詞進行提取。經過人工篩選,包括去重合并、剔除無意義詞和停用詞后,對四類文本的詞頻統計進行文本聚類分析。
數據研究發現,ZARA和H&M各自的三類商業意見領袖在靜態、動態興趣上的差異不大,此處將三個社群類別做合并處理,并根據高頻特征詞分類,按照詞頻高低從中篩選出ZARA和H&M商業意見領袖群體的興趣標簽詞集,如圖2所示。兩個品牌的靜態興趣在職業和社會屬性上差異較為明顯,ZARA商業意見領袖中具有差異性的群體是專家、母嬰育兒、媒體,而H&M的差異性群體為辣媽、教師、影評人。動態興趣差異主要體現在六個方面,即服裝類型、服裝質地、服裝風格、美容產品的質地和效果、價格和明星類型。
考慮到用戶影響力比較分析能夠反映企業營銷活動中商業意見用戶畫像的基本標簽和興趣標簽產生差異的原因,本文借鑒劉玲等人提出的用戶影響力分析模型(如圖3所示)和公式,計算和比較相關指標,針對社交網絡商業意見領袖的用戶影響力進行比較分析,以進一步剖析兩家企業的微博意見領袖的用戶畫像產生差異的原因。
各項指標計算公式如下:
用戶影響力指數=用戶質量指數×近期用戶活躍度 (1)
用戶質量指數=微博平均轉發率+微博平均評論率+微博原創豐富度 (2)
近期用戶活躍度=最近30天內所發微博數量/30天(3)
微博平均轉發率=被轉發總數/所發微博總數/微博總粉絲數 (4)
微博平均評論率=被評論總數/所發微博總數/微博總粉絲數 (5)
微博原創豐富度=(原創微博數+帶圖片和視頻的微博數)/所發微博總數/微博總粉絲數 (6)
本文研究重點為兩個品牌的三個社群用戶畫像比較,故將每一類微博商業意見領袖看作一個整體,進行匯總加和后,計算相關的數據指標,以此方法所得到的結果偏差對研究結論影響較小,可忽略不計。
通過上述公式計算結果如表1所示。

表1 ZARA和H&M三類商業意見領袖用戶影響力指數

圖3 用戶影響力分析模型

圖4 ZARA和H&M用戶畫像比較分析總結
從單個品牌來看,ZARA的時尚類意見領袖的用戶影響力最強,娛樂明星類意見領袖影響力最弱;H&M則表現為娛樂明星類意見領袖的用戶影響力最強,美妝類商業意見領袖用戶影響力最弱。從三個類別分別來看,在時尚類商業意見領袖中,ZARA的意見領袖用戶影響力高于H&M。在美妝類中ZARA的微博商業意見領袖用戶影響力低于H&M。而在娛樂明星類中,兩個品牌之間差距懸殊,H&M的微博商業意見領袖影響力約為ZARA的26倍。
上述分析結果顯示,ZARA和H&M的三類微博商業意見領袖在用戶基礎標簽上H&M年齡明顯大于ZARA。在興趣標簽方面,靜態興趣差異較小,且不同類別微博商業意見領袖之間幾乎無異;差異主要體現在動態興趣上,不同類別微博商業意見領袖之間具有明顯的興趣差異,針對上述分析的總結如圖4所示。該結果在一定程度上能夠幫助企業判斷其社交網絡的商業意見領袖的基本特征和興趣傾向,但難以幫助企業精準識別更有利于品牌傳播的社交網絡商業意見領袖,具有局限性。因此,本文將進一步分析兩個品牌不同類別社交網絡商業意見領袖影響力之間的差異,從而幫助企業識別出本品牌粉絲群體中影響力最高的社交網絡商業意見領袖類別。
結合原始數據分析,可以發現兩個品牌的三類意見領袖的基本標簽和興趣標簽出現差異各自的根本原因:時尚領域方面,H&M的意見領袖群體在總粉絲數量上雖占據一定優勢,但所發布的微博數量相比ZARA較少,失去了大粉絲集群的優勢,從而降低了其意見領袖的用戶影響力。美妝領域方面,ZARA微博的意見領袖群體雖然擁有較多粉絲,但其被評論和轉發總數顯著低于H&M,且微博內容缺乏吸引力,難以刺激其粉絲參與到話題中來,導致了該類意見領袖群體的用戶影響力較低。在娛樂明星領域中,H&M在各層級的指標都優于ZARA,且對比后發現,對H&M而言,娛樂明星類意見領袖群體的影響力最強,更容易傳播和產生熱點話題,能夠幫助H&M在該類社群中的信息傳遞。
第一,從基礎標簽來看,ZARA和H&M的商業意見領袖間除年齡特征外均差異較小,都具有女性居多、一線城市為主以及微博使用年限較長等特點,說明兩個品牌的客戶群在實際生活中具有較大的重疊性。H&M商業意見領袖在31-40歲年齡段的比重明顯大于ZARA,說明兩個品牌的目標消費群體年齡差異較為明顯,企業可以根據這些特征,并結合本企業的目標市場定位挖掘新的潛在市場。
第二,從興趣標簽來看,基于對文本數據的語義分析,發現靜態興趣特征的差異主要表現在職業和社會屬性方面,在動態興趣特征上的差異則主要體現在服裝類型、質地、風格,美容產品的質地等方面。所以兩個企業可以根據各自微博商業意見領袖群體的興趣傾向,改進本品牌的產品設計、宣傳方式和渠道等策略。例如,ZARA的微博意見領袖在動態興趣中更傾向“復古”風格的服裝,與H&M的意見領袖偏好“優雅”“青春休閑”以及“可愛”的風格差異顯著,尤其是結合H&M較ZARA微博意見領袖年齡偏大的事實,會發現年齡偏大的群體傾向于“年輕”的風格;年輕的群體卻傾向于“成熟”的風格。因此H&M和ZARA可以在服裝產品設計上,可以更加迎合消費者的傾向,滿足消費者的需求。
第三,從用戶影響力來看,微博商業意見領袖的微博被轉發率、被評論率和原創豐富度是影響其用戶影響力的主要因素。因此,微博商業意見領袖應不斷增強其發文內容的吸引力,以促進其影響力的提升。例如,娛樂明星類微博商業意見領袖用戶影響力較弱的ZARA可以通過舉辦線上、線下相結合的營銷活動,調動這些意見領袖參與線下體驗、線上分享及轉發、評論的積極性,從而增強其影響力,提高企業知名度。