王雪蓮 陳晶晶 馬玉倩



摘 要:本文基于大數據采集分析方法,采集國產美妝品牌用戶的微博公開數據進行清洗并分析后,對有效文本內容分詞、打標處理,利用用戶畫像標簽體系將數據標簽化,并通過數據可視化得出基于微博數據的國產美妝品牌用戶畫像,以用戶畫像分析為依據提出國產美妝品牌的營銷建議。
關鍵詞:用戶畫像;國產美妝品牌;微博
近些年,國民品牌以全新的方式回歸大家的視野,掀起一股“國潮之風”,而在這場來勢洶洶的國潮之中,最受關注的便是國產美妝品牌。在理論和實踐方面,本文的研究充實了國產美妝領域的研究內容,有利于了解國產美妝品牌的用戶狀況,并為國產美妝品牌營銷者的決策提供依據。
一、國產美妝的現狀
在以往認知中,國外大品牌長時間占據我國美妝市場的紅海,廉價、質量差是大眾對國產美妝品牌的評價,而近幾年今國產美妝借助互聯網的支持和邊界迅速崛起,不僅表現在品牌數量的快速增多,而且國產美妝品牌市場份額快速提升,市場份額占比超過50%,用戶認知和好感度提高,與之前的原有形象形成明顯反差。與之前的價格決定消費時代購物習慣不同,如今更多的消費者愿意為個性化而買單,影響消費者選擇產品的最重要因素成為品牌的獨特的創新與差異化。重新布局的美妝市場中,國產美妝的消費群體特征也發生了改變,例如“他經濟”的崛起、美妝消費理念的改變、消費群體獲知或消費國產美妝產品的方式的變化。消費者需求端的消費習慣和審美變化,推動著美妝行業的不斷更新發展,結合國產美妝用戶特征,美妝品牌企業不僅要在技術改革的背景下創新產品工藝,同時還要重視社交媒體與消費者互動,緊追熱點IP創立聯名產品,在產品體驗過程中結合AI技術,提升用戶的全方位消費體驗。
二、國產美妝品牌用戶畫像研究流程設計
本文在對現有用戶畫像建立方法的研究之上權衡考量,選取利用集搜客和python工具來幫助建立基于微博數據的國產美妝品牌用戶畫像。首先,在微博平臺獲取與國產美妝品牌內容相關的用戶的數據,然后預處理獲取的數據,再結合對用戶的基本信息和生成內容數據的挖掘分析的結果,建立用戶畫像標簽體系,并與數據內容相對應,最后將標簽和統計數據通過合適的可視化工具進行圖表展示,從而獲得基于微博數據的國產美妝品牌用戶畫像。用戶畫像構建流程如圖1所示。
三、國產美妝品牌用戶數據采集
(一)采集對象內容
根據美妝產品的實際功能劃分,可以將美妝行業分為護膚領域和彩妝領域。護膚領域主要包括大眾護膚、兒童護理等,而彩妝盤、香氛、藥妝、化妝工具等屬于彩妝領域。根據國產美妝的發展時期可以將其劃分為兩類,一是早期傳統品牌,二是新生代品牌。按照上述劃分品牌的兩種標準,選取2019年國產美妝品牌銷量排行榜中的代表品牌,可以將國產美妝品牌分為四類,如表2所示。
確定采集數據所需的國產美妝品牌的代表品牌后,需要確定采集內容。首先利用微博的關鍵詞搜索功能,可以獲取以代表品牌名稱為關鍵詞的內容,包括博文內容、轉發數、評論數、點贊數等以及博主名稱、頭像、主頁鏈接,采集該結果。然后以博主作為國產美妝品牌的用戶對其信息數據采集并分析,主要包括對用戶的基本信息(名稱、性別、年齡、所在地、個性標簽、關注、粉絲等)的采集以及對用戶主動生成的內容(用戶主動創作的微博原文、轉發微博等)的采集。
(二)數據采集結果
利用集搜客平臺對微博數據進行采集,首先通過關鍵詞搜索結果采集,獲取以“佰草集、一葉子、瑪麗黛佳、完美日記”為關鍵詞的搜索結果內容,采集關鍵詞下的搜索內容的前50頁,利用采集獲得的博主主頁鏈接,采集博主的個人基本信息,經過清洗過程,篩選提出不符合要求的博主后,視為國產美妝代表品牌用戶。對這些用戶的主動生成文本內容進行采集,分別采集每位用戶的博主主頁前5頁內容作為原始數據,經過數據清洗過程,篩選提出與構建用戶畫像無關的內容,以剩余的微博內容作為分析的基礎數據。
(三)數據清洗處理
數據采集的結果并不能直接用于下一步數據采集或者數據分析,主要是因為采集到的博主基本信息存在缺失、重復等問題,故對采集到的數據首先進行預處理,剔除重復、確實關鍵內容的數據所在行,以及不符合用戶基本信息的規則的用戶。之后,由于每個用戶的微博發布和轉發的內容較多,因此再對用戶生成內容的文本進行清洗,常用的清洗方法包括數據數值化、標準化、數據降維等,主要是根據文本清洗規則篩選去除不符合要求的內容以免影響整體數據的準確性,再通過隨機抽取樣本進行檢測,若合格率達到90%以上則不再繼續清洗。具體要求如表3所示。
通過清洗獲得國產美妝品牌用戶的合格有效的用戶基本信息后,還需要采集用戶主動生成內容即微博內容后進行文本分析,勾畫用戶畫像,但由于微博內容存在數據無效等問題,故通過機器學習和人工篩選的方法按照用戶生成內容清洗要求進行修改或剔除,具體要求如表4所示。
本文主要依據清洗規則,利用Python和Excel工具和手工操作對采集到的2912位用戶基本信息和86342條微博文本數據進行清洗后,得到1323位用戶基本信息和26453條微博文本數據,并且隨機抽取200條數據后,符合數據清洗規則的數據達到90%,因此認為清洗后的數據符合繼續分析的要求。
四、國產美妝品牌用戶數據分析
(一)建立用戶基本信息數據標簽
微博平臺在用戶注冊和使用過程中會提示用戶完善個人基本信息,包括昵稱、個人簡介、性別、所在地、生日、星座、QQ郵箱等,除必要設置的昵稱外,大多數人會完善性別、所在地、生日、星座等基本信息,故選擇該四項作為用戶基本信息的標簽,建立用戶基本信息數據標簽體系。
(二)建立用戶生成內容數據標簽
本文借助結巴分詞工具,對采集到的1323位用戶基本信息和26453條微博數據進行分詞處理,并統計所有文本中重復的詞組的重復次數,獲得高頻詞的詞頻統計,輸出頻率較高的前40個關鍵詞及詞頻數并構建關鍵詞網絡關系圖,從中可以看出用戶生成內容的文本中出現頻率較高的名詞關鍵詞所屬領域較為廣泛,并且相互之間存在緊密聯系,所屬領域包括娛樂明星、產品品牌、興趣愛好、行為習慣、關注熱點等多個,故對關鍵詞進行分類匯總,選取合適的關鍵詞作為標簽,并依據不同領域及主題構建事實標簽體系。依據構建好的用戶生成內容事實標簽體系,以及作為標簽詞的關鍵詞庫,利用集搜客的文本分析分詞分類檢索工具,對采集到的所有文本信息進行打標處理,使得每一條文本數據都對應著一個或多個標簽,提取相同標簽統計分析,選擇合適的可視化圖標對統計結果進行展示。
五、國產美妝品牌用戶數據可視化
分別對采集到的有關“佰草集、一葉子、瑪麗黛佳、完美日記”的微博用戶的數據信息進行分析,按照用戶基本信息、用戶興趣和關注、用戶行為習慣三大方面內容對國產美妝代表品牌的用戶數據進行數據清洗、標簽化處理、可視化展示后,得到不同的代表品牌用戶畫像,如圖5—圖8所示。佰草集的用戶主要是女性白領人群,身兼家庭和工作兩大重任,壓力較大更加關注自然健康護膚和生活。
一葉子的用戶主要是職場女性新人,進入職場時間不長,在學校和社會的生活環境轉換過程中,由于生活作息不規律,所以更加關注某些特定問題的護膚解決,日常忙于工作,喜歡關注直播,偏愛網上購物,樂于交友和分享購物體驗。
瑪麗黛佳的用戶主要是熟練化妝的女性,工作需要化妝,且妝齡較長,對自己的皮膚特點、產品特色有較多了解,追逐潮流的同時敢于自我創新。
完美日記的用戶主要是化妝新手,男女性均有,但女性較多,接觸彩妝產品時間不長,化妝技巧掌握不多,更依賴化妝教程和簡單通用的彩妝產品。用戶年齡不大,個性標簽95后。
六、國產美妝品牌營銷建議
分析國產美妝品牌的用戶畫像可知,國產美妝品牌營銷對象重點,應為女性同時要兼顧某些男性需求,同時選擇合適的IP跨界營銷推出聯合產品,能較快地拓展用戶,并在產品體驗中結合AI技術,全方位提升用戶的消費體驗。國產美妝品牌的產品設計、營銷渠道、價格界定等多方面應當依據品牌理念和宗旨的同時,結合目標用戶的特點來設計推廣。
以“佰草集”為代表品牌的早期國產護膚品牌,用戶普遍年齡偏高,膚質較差,較為關注產品的品質成分,用戶的生活習慣主要集中在線下購買、軟技能能力的提升等,偏愛文藝活動例如沙龍分享等。品牌商在營銷時要著重宣傳產品的成分質量、原生態產品原料、精細萃取加工技術、良好可觀的護膚效果等,通過廣告、視頻、圖片等多重形式結合,結合較為大眾的渠道,讓客戶直觀感受到產品的護膚功效,吸引消費者體驗。
以“一葉子”為代表的新生代國產護膚品牌,用戶主要是青年,存在明顯的膚質問題,品牌商在營銷時要著重宣傳產品的天然原料和膚質問題解決效果,利用目前較為活躍的明星作為代言人,增加產品曝光度,通過短視頻、小廣告等多種方式出現在微博、小紅書等新興活躍的娛樂社交平臺,吸引消費者的注意力。
以“瑪麗黛佳”為代表的力量型國產彩妝品牌,用戶具有較長時間的彩妝使用時間,有明確的產品類型購買偏好,對產品的設計、質量要求較高,用戶的職業呈現出明顯的美妝的需求,主要是明星、網紅、模特、主持等,會活躍出現在公眾面前,對于時尚等方面有獨特的見解。品牌商在營銷時要著重宣傳品牌的價值觀、產品設計的獨特性等,營銷渠道主要是品牌旗艦店、超話等成熟渠道,設計與熱點事件相關的活動,結合抖音、微博等渠道擴大產品影響。
以“完美日記”為代表的新銳國產彩妝品牌,用戶接觸彩妝時間短,對彩妝了解較少,期待產品設計的簡單和效果的明顯,用戶主要是在校學生等,主要活躍場所是學校,線上社交平臺較為活躍,具有較大的朋友圈網絡。品牌商在營銷時著重突出產品使用的簡單教程、真實效果展示,主要渠道是通過主播直播時的使用推薦、小紅書分享體驗推薦等,從主播的使用到“種草”“拔草”的過程中逐漸利用社交網絡擴大影響范圍,提升產品的知名度等。
結束語:
分析國產美妝品牌的用戶畫像可以得知,品牌商結合自身特點的同時合理選擇合適的熱門IP跨界營銷推出聯合產品,能較快地拓展新用戶,營銷方式不局限于廣告等傳統方式,更要結合目標用戶的行為特點,利用直播、抖音、小紅書等新渠道在品牌商營銷推廣的同時,借助用戶的真實體驗和分享獲取更多用戶。
參考文獻:
[1]劉星辰.基于文本挖掘的用戶畫像系統的設計與實現[D].北京郵電大學,2018.
[2]張昊.基于文本情感分析的電商在線評論數據挖掘[J].現代經濟信息,2019(17): 340.
[3]歐陽秀平,廖娟,馮燁,劉卉芳.基于運營商大數據的游戲用戶畫像構建研究[J]. 郵電設計技術,2019(09):40-44.
[4]翟劍鋒.基于 BERT 的用戶畫像[J].電子技術與軟件工程,2019(24):253-255.
作者簡介:王雪蓮(1979-)女,漢族,河北工業大學經濟管理學院,副教授,博士。研究方向:消費者行為研究。