李勇 譚小玲 陳曉婷 管慧



[摘要]通過構建安化黑茶產品的用戶畫像,分析其用戶群體的消費行為特征,可為商家提供多維度的產品用戶信息,便于商家了解用戶,進而改進產品與服務,為安化黑茶電商營銷策略提供決策依據。以京東、天貓、淘寶三大電商平臺為基礎,使用python的scrapy第三方庫采集淘寶、京東電商平臺安華黑茶的評價數據,并對數據進行清洗、去空值、去停用詞等預處理,運用jieba第三方庫對評論數據進行分詞、詞頻分析,完成對安化黑茶用戶特征的完整刻畫。結合客戶評論數據分析,可知安化黑茶近3/4用戶為男性;山東省為安化黑茶網購大省;網購渠道依次為淘寶、京東、天貓;關注安化黑茶的人更喜歡教育、汽車服飾、綜藝等;消費者對安化黑茶訴求如“減肥”、“抗衰老”、“降血脂”等比例升高。
[關鍵詞]用戶畫像;安化黑茶;電商營銷;數據分析;文本挖掘
[中圖分類號]F724.6;F323.7 [文獻標識碼]A
1 引言
近年來,電子商務發展迅速。湖南安華黑茶借助電商平臺的便捷化優勢,拓展了線上營銷渠道,其線上電商平臺的商品評論區也逐漸成為消費者發表商品訴求的交流平臺。因此可以通過獲取用戶的評論數據,來挖掘用戶的需求,以此幫助湖南安化黑茶提升品牌價值、增強市場競爭力。而大數據環境下的用戶畫像分析是近年來深度挖掘用戶需求的重要方法。國內外學者不斷關注用戶畫像方面的研究,其中用戶畫像精準營銷是當前研究的熱點。
用戶畫像這一概念最早由交互設計之父Alan Cooper提出,其認為用戶畫像是真實用戶的虛擬代表是建立在真實數據之上的目標用戶模型。Teixeira C、Pinto J S、Martins J A等國外研究者認為用戶畫像是一個獨立的描述用戶需求、偏好和興趣的模型,是從海量數據中提煉的個人信息的數據集合。中國科學技術信息研究所信息資源中心主任曾建勛認為,用戶畫像是指獲取用戶的專業背景、文化程度、知識獲取習慣、興趣偏好、特長任務等與用戶需求趨向相關的信息,以此為基礎進行模型化表示,為用戶制定特定標簽。雖然研究者對用戶畫像的概念表述存在一定差異,但研究者一致認同用戶畫像是面向用戶展開的基于真實數據進行的研究。ZorattiS等提出了如何利用數據挖掘事物間的關聯性并應用到精準營銷中;KennedyDS從移動互聯網的角度提出精準營銷的具體實施方法;ZhenY等提出了精準營銷的決策框架,通過識別不同類別客戶之間的潛在特征,提出適當的精準營銷策略。用戶畫像技術還逐步涉及個性化搜索、城市計算、預測用戶年齡、興趣愛好、性別、地理位置等。用戶畫像有兩個層次的定義。第一種是從產品設計、運營過程中從用戶群體中抽象出來的典型用戶,能夠表達用戶群體的主要需求和期望。第二種是基于特定使用情境下真實的用戶行為數據所形成的描述用戶屬性及其行為的標簽集合。第二種層次的用戶畫像更具有真實性以及較強的時效性。
近幾年,關于用戶畫像精準營銷的決策框架的研究越來越多,但涉及具體案例及具體應用的研究較少,因此,本文構建用戶畫像是針對第二層次,根據客戶的評價數據,抓住其需求特征,進行用戶畫像分析與可視化的構建,為企業確定目標客戶,制定精準的營銷方式、迎合不同消費者的需求提供依據。研究內容包括兩部分,第一部分是通過獲取用戶的評論數據來搜集用戶屬性信息,將屬性信息標簽化以便對用戶進行畫像。第二部分是基于用戶畫像挖掘消費者對于安化黑茶的需求,實現對企業精準營銷方式的進一步完善。
2 客戶評價數據的采集與處理
構建用戶畫像,應從用戶留在網絡上的“數據足跡”的采集、整理與歸類開始。用戶發表評論的時間、內容屬性、追加評論、評論圖片是用戶數據采集的主要來源,采集數據之后需要對用戶數據進行有效過濾,去除無效、雜亂數據,過濾之后對海量的用戶評論數據進行清洗、分詞、詞頻分析等處理,發現其中隱含的有價值的信息,再通過文本處理工具與情感分析工具構建用戶畫像,主要從用戶特征、購買渠道、地域分布、關聯產品這幾個方面進行可視化呈現,具體如圖1所示。
2.1 客戶評價數據采集
據公開資料顯示,中國網民已經達6.88億,其中90.1%的通過手機上網,手機網民達6.2億,超過70%網購消費發生在移動端,電商網絡逐漸成為主流。而在眾多電商平臺中,天貓、淘寶電商平臺年度活躍用戶達5.76億,天貓商家店鋪數量達23萬,淘寶商家店鋪數量達1000萬;京東電商平臺年度活躍用戶達4.18億,已注冊京東商城的商家超過20萬。
據此,本文以淘寶、京東為數據采集對象,使用python的scrapy第三方庫爬取對淘寶、天貓、京東有關安化黑茶的客戶評論數據。由于淘寶、京東平臺上的安化黑茶商家眾多且經營商品復雜,不利于后期數據分析工作。因此本文根據店鋪的好評率、收藏人數、經營年數將天貓、淘寶店鋪分成“金色皇冠”商家、“藍色皇冠”商家、“藍色鉆石”商家并從這三類商家中分別選取三個最有影響力的商家,從京東旗艦店、自營店、第三方賣家三類商家中分別選取三個最有影響力的商家,選取這六個店鋪的客戶評價作為數據樣本,具體店鋪選取情況如表1所示。
將以上三家天貓、淘寶店鋪的安化黑茶客戶評價作為關鍵詞,采集客戶評價數據并將數據采集結果保存至Excel表格中。本文共采集了10個字段,主要涉及電商消費者發布的評價內容及時間等,共采集到13571條數據,數據采集結果如圖2所示。將采集的三家京東店鋪的安華黑茶客戶評價數據保存至Excel表中,共采集到12037條數據,局部數據采集結果如圖2所示。
2.2 客戶評價數據預處理
通過本次研究的客戶對于安化黑茶的評價,對應的客戶對于安化黑茶的喜好程度與改善建議,從而對安化黑茶的客戶做用戶畫像,因此只有客戶評價內容不為空才對本次研究有意義,所以將數據中空字段評論過濾掉。同時,用戶的評論列表里可能存在部分過短的評論信息,經過調查研究,發現8個字以上的評論信息為有效的評論信息,故以此清洗掉少于8個字的用戶評論,最終得到天貓、淘寶有效評論數據12065條,京東有效評論數據10087條數據。
5 結語
本文以大數據背景下安化黑茶的用戶畫像為研究對象,通過python對天貓、淘寶、京東三大電商平臺進行數據采集,對三大電商平臺的不同等級安化黑茶店鋪的客戶評價進行文本挖掘與分析,再通過構建用戶畫像對不同的消費者進行消費行為可視化,在此基礎上進行用戶畫像分析。從多維度對用戶的潛在需求進行精確畫像,不斷提升營銷與推廣的精準性,不斷為發展安化黑茶業務和改善公司形象、為大數據時代安化黑茶企業的發展降本增收。
[參考文獻]
[1] 張小可,沈文明,杜翠鳳.貝葉斯網絡在用戶畫像構建中的研究[J].移動通信,2016(22):22-26.
[2] Teixeira C, Pinto J S, Martins J A. User Profiles in organizational Environment [c]. funchal, Madeira, Portugal: the Fourth International Conference on Web Information Systems and Technologis,2008:329-332.
[3] 曾建勛.精準服務需要用戶畫像[J].數字圖書館論壇,2017(12):1.
[4] Zoratti S, Gallagher L. Precision Marketing: Maximizing Revenue Through Relevance[M]. Kogan Page,2012.
[5] Kennedy D S. The Ultimate Marketing Plan: Target Your Audience! Get Out Your Message! Build Your Brand! [M]. Adams Media,2014.
[6] Zhen Y, Si Y, Zhang D, et al. A decision-making framework for precision marketing[J]. Expert Systems with Applications,2015(7):3357-3367.
[7] Luo F, Wang J Z, Promislow E. Exploring local community structures in large net-works[J]. Web Intelligence and Agent Systems: An International Journal,2008(4):387-400.
[8] Yuan N J, Zhang F, Lian D, et al. We know how you live: exploring the spectrum of urban lifestyles[A]. Proceedings of the first ACM conference on Online social networks[C].ACM, 2013:3-14.
[9] Rosenthal S, McKeown K. Age prediction in blogs: A study of style, content, and online behavior in pre-and post-social media generations[A]. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies[C]. Association for Computational Linguistics, 2011:763-772.
[10] Chaabane A, Acs G, Kaafar M A. You are what you like! information leakage through users interests[A]. Proceedings of the 19th Annual Network & Distributed System Security Symposium (NDSS) [C].Citeseer, 2012.
[11] Liu W, Ruths D. Whats in a name? using first names as features for gender inference in twitter[A]. AAAI spring Symposium: Analyzing Microtext[C].2013.
[12] Burger J D, Henderson J, Kim G, et al. Discriminating gender on twitter[A]. Proceedings of the Conference on Empirical Methods in Natural Language Processing[C].Association for Computational Linguistics, 2011:1301-1309.
[13] Chen J, Liu Y, Zou M. Home location profiling for users in social media[J]. Information & Management,2016(1):135-143.
[14] Jurgens D. Thats what friends are for: Inferring location in online social media platforms based on social relationships[A].? Proceedings of the 7th International Conference on Weblogs and Social Media [C].JCWSM, 2013:273-282.
[15] Li R, Wang S, Deng H, et al. Towards social user profiling: Unified and discriminative influence model for inferring home locations[A]. Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C]. ACM, 2012:1023-1031.
[16] 張海濤,崔陽,王丹,等.基于概念格的在線健康社區用戶畫像研究[J].情報學報,2018,37(09):912-922.