999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于微博的大數據用戶畫像與精準營銷

2016-11-09 05:01:27曾鴻吳蘇倪
現代經濟信息 2016年24期
關鍵詞:大數據

曾鴻 吳蘇倪

摘要:在大數據時代,通過有關技術手段對新浪微博數據進行采集分析,構建用戶畫像模型,描述企業用戶群體行為特征,為精準營銷帶來了可能。用戶畫像系統為企業提供全方位的掌握客戶群體的信息標簽,使企業了解、認知自己的客戶。同時在品牌的傳播與建設中,用戶畫像也是一個不錯的思路。這為企業制定科學準確的營銷方案打下了良好的基礎。

關鍵詞:大數據;用戶畫像;精準營銷

中圖分類號:TS941.1 文獻識別碼:A 文章編號:1001-828X(2016)024-000-03

User image and precision marketing on account of big data in Weibo

School of Statistics, Chengdu University of Information Technology

Zeng Hong Wu Su Ni Chengdu 610103

In the era of big data,collect and analyseWeibos data by relevant technology、structure userimage model and describe company user groups behavior characteristics make precision marketing possible. User image system let company obtain user groups information label comprehensively,then company can know its own customers. At the same time, user image is a good thinking in brands diffusion and development.It makes a good base for company to make the scientific and accurate marketing programme.

Keyword:Big Data、User Image、Precision Marketing

大數據(big data),是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

IDC調查公布人類在2003年全部的數據只有5EB,只相當于現在兩天的數據,到2020年全球的數據將達到35ZB。豐富的數據資源蘊含了大量的客戶信息,如何利用大數據為企業營銷服務是當今企業正在探索的問題,也是未來企業致勝的法寶。企業可以運用大數據,對廣大的人群進行篩選,得到目標用戶,然后通過對目標用戶的分析,得到目標用戶的需求和特點,從而進行精準化營銷。

大數據在企業市場營銷中的應用,最先開始的是淘寶、騰訊、京東等幾大電商的廣告推薦系統。當瀏覽、購買或收藏了某些商品后,網民總能在商城的某個位置看到類似于“猜你喜歡”的內容推薦,或者說當網民在網上閱讀一篇文章、觀看一個視頻或者和他人聊天時,總是能彈出一個廣告推薦窗口,推薦的內容恰好是最近自己關注過的相關商品的信息,這便是典型的大數據精準營銷的應用之一。

在大數據精準營銷中,企業擁有自身的數據是遠遠不夠的,業務本身帶來的數據,往往容易形成信息孤島。隨著大數據技術的發展與應用,通過網絡蜘蛛或爬蟲,對消費者在互聯網上留下的消費痕跡進行數據爬取,形成數據倉庫,對每一個消費者進行用戶畫像,從而實現廣告的精準推送,為企業抓取產品潛在的用戶群體,提升產品的知名度和曝光度,使企業在市場占有一定份額,最終給企業帶來盈利。

一、用戶畫像

在互聯網逐漸步入大數據時代后,不可避免的給企業和消費者行為帶來一系列改變和重塑。其中最大的改變莫過于消費者的行為在企業面前將是“可視化”。隨著大數據技術的深入研究和應用,企業的專注點日益聚焦于怎樣利用大數據來為精準營銷而服務,于是“用戶畫像”的概念由然而生。

用戶畫像,即用戶信息的標簽化,是真實用戶的虛擬代表,是建立在一系列數據之上的目標用戶模型。用戶畫像根據用戶的社會屬性、生活習慣和消費行為等信息,抽取出一個或一類用戶的標簽,給用戶信息進行結構化處理。用戶畫像的意義在于了解用戶,猜測用戶的真實需求和潛在需求,精細化地定位人群特征,挖掘潛在的用戶群體,為媒體網站、廣告主、企業及廣告公司充分認知群體用戶的差異化特征,幫助客戶找到營銷機會、運營方向,全面提升企業的核心影響力。

1.用戶畫像的數據源獲取

用戶畫像首先要獲得的是用戶的行為數據,在互聯網上,用戶的行為數據大多來自網站的訪問日志,日志里記錄了用戶在網站的瀏覽、搜索、點擊、跳轉等一系列用戶行為軌跡,這些不斷變化的行為信息,歸屬于用戶的動態數據。在大數據的技術運用中,除了網站的訪問日志外,還可以利用網絡爬蟲技術,追蹤用戶在全網的行為信息,根據關聯規則,聯系到用戶的行為偏好,將完善用戶畫像的模型,提高預測用戶需求的概率,這需要確保用戶IP的一致性,保證追蹤到的用戶信息的前后是一致的。

除了用戶的行為信息外,用戶畫像還需要用戶的個人信息,例如:用戶的姓名、年齡、性別、職業、收入、地區、手機號等人口基本屬性,這些信息相對穩定,可以歸屬為用戶的靜態信息。

對收集得到的用戶畫像數據進行訓練,利用數據挖掘算法模型,抽取出用戶畫像標簽,構建用戶畫像標簽體系。

2.用戶畫像標簽建模

用戶畫像的焦點工作就是為用戶打“標簽”,而一個標簽通常是人為規定的高度精煉的特征標識,如年齡、性別、地域、用戶偏好等,最后將所有標簽綜合起來,就可以勾勒出該用戶的“畫像”了。用戶畫像的核心工作是為用戶打標簽,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息。用戶標簽要求呈現出兩個主要的特征,一是語義化,人能很快理解每個標簽的含義,二是短文本,每個標簽通常只表示一種含義。

用戶畫像標簽建模主要包括四個步驟,首先得取得原始數據,這里的原始數據主要包括企業歷史交易數據和用戶的基本信息數據,另外一部分是互聯網數據,這部分數據主要通過網絡爬蟲等技術,對用戶行為數據進行爬取;其次對原始數據進行統計分析得到事實標簽,例如年齡分布、性別比例、購買頻率等;然后對事實標簽進行建模分析,得到模型標簽,例如人口屬性、產品購買偏好和用戶關聯關系等;最后進行模型預測,得到預測標簽,主要是對未來數據的一種用戶行為預測。

二、基于微博的話題聚合和用戶畫像

新浪微博擁有超5億級的用戶數,這海量的數據后面隱藏著巨大的商業價值。新浪微博在用戶注冊的過程中,已有一些用戶的基礎信息,諸如年齡、地域、性別、關注數、粉絲數、興趣標簽等,但這些弱關系數據信息還不足以給定一個人或一群人的用戶畫像,為了使用戶畫像描述更加精確,還缺少相應的興趣圖譜。在新浪微博海量的數據中,不可能分析每一條用戶微博后面的興趣傾向,為此新浪微博通過興趣話題,把對話題同樣感興趣的一類人聚合到一起,參與話題討論,這樣通過話題聚合,就能獲取這類人群的信息,提取該類人群標簽,構建人群用戶畫像,這樣作為商家、廣告商,就能對該類人群進行微博廣告投放,達到精準營銷的目的。

1.數據源獲取

本文數據來源于新浪微博熱門話題數據,通過網絡爬蟲和微博指數,對數據進行采集、統計與分析。

通過利用爬蟲軟件,爬取了微博熱門話題榜的數據。首先提取熱門話題榜的話題和分類標簽,共爬取了700條數據,然后進行數據篩選、清洗,得到有效數據614條。通過數據預處理后的數據,集成數據倉庫,初步對數據進行描述性統計分析,本文主要進行的是分類數據統計,對于統計結果進行排序,挑選話題討論最多的標簽進行接下來的數據挖掘工作。

新浪微博為用戶提供微博數據統計,微博指數是基于海量用戶行為數據、博文數據,采用科學的統計方法得到反映不同事件領域發展狀況的指數。本文將通過提取關鍵字,對用戶群體進行標簽化,最終對微博話題人群聚類畫像。

2.數據描述

新浪微博提供的話題分類標簽共37個,具體包括明星電視劇、社會、綜藝、電影、音樂、動漫、情感、美食、時尚美妝、旅游、讀書、公益、美圖、生活記錄、教育、體育、文化藝術、笑話、運動健身、創意征集、科技、汽車、電視節目、財經、萌寵、游戲、健康、情感兩性、星座、搞笑幽默、化妝造型、數碼、投資理財、網絡文學、休閑娛樂、政務。通過網絡爬蟲,對新浪微博話題榜的數據進行爬取,包含話題名稱和話題標簽,爬取結果部分內容截圖如圖。

對爬取的結果,按標簽進行排序分類統計描述,得到熱門話題榜里,37個標簽提及數,通過排序可以看出排名前10的標簽依次是明星、電視劇、社會、綜藝、電影、音樂、動漫、情感和美食。

3.用戶畫像構建

新浪微博提供了一個明星和粉絲對話交流的平臺,粉絲可以在微博關注自己喜歡的明星,與明星互動,拉動了明星和粉絲之間的交互作用;而明星的一些商業活動,對于粉絲來說便是一種刺激消費,這里的商業活動包括明星代言的廣告、主演的電影、電視劇、出席的活動等,相應而產生的便是叫做“粉絲經濟”的經濟模式。對于企業來說,將企業營銷決策與明星效應相結合,聚合該類粉絲人群,通過大數據對人群進行用戶畫像,掌握該類人群特征,對這些用戶粉絲進行廣告投放,有的放矢,避免了過多的廣告輸出造成的消費者反感。

在新浪微博的明星勢力榜里,選取兩位明星,對其粉絲人群進行人群畫像。微博明星勢力榜將對在一段時間內排名前50的明星進行打分,評分維度有提及量、互動量、搜索量和粉絲愛慕值四個維度。

選取2016年3月份微博明星勢力榜排名前10明星榜單,按綜合得分大小降序排序如圖3-5所示,分別有TFBOYS-易烊千璽97.41、TFBOYS王俊凱97.25、許魏洲90.72、黃景瑜90.69、王凱87.57、TFBOYS-王源87.43、鹿晗86.82、李易峰85.84、楊洋84.63、吳亦凡83.84。

新浪微博每天都能產生大量的數據,基于海量的用戶行為數據、博文數據,新浪微博為廣大用戶提供關鍵詞微博指數,采用科學的計算方法統計得出的反映不同事件領域的發展狀況。新浪微博指數包括熱詞趨勢、實時趨勢、地域解讀和屬性分析四個部分。基于微博數據,就可對明星類標簽進行微博話題人群用戶畫像建模。

選取TFBOYS組合和王凱兩位明星進行關鍵詞的微博話題人群畫像,時間自定義選擇為2016年3月1日到2016年3月31日。

圖3為輸入關鍵詞“TFBOYS”的整體趨勢圖,圖4為移動端和PC端趨勢圖。由圖可知,TFBOYS在整個三月份微博被提及量都比較高,整體趨勢當月熱議均值達到931541次,當月最高達1245028次,PC端當月熱議均值達241611次,最高達340919次,移動端當月熱議均值達689930次,最高達904109次。

從地域熱議度和用戶熱議度看(圖略),在排名前十的地域城市中,地域熱議度和用戶熱議度差異并不大,其中排名前三熱議度地區分別為廣東、重慶和北京。

在屬性分布下,主要是提及到TFBOYS的人群屬性信息。在性別比例中(圖略),男性占16.96%,女性占83.04%。在年齡分布下(圖略),12到18歲年齡段人數最多,占38.18%,19到24歲占35.38%,25到34歲占13.92%,35到50歲占7.65%,12歲以下占4.58%,51到80歲占0.28%。在人群標簽比例中(圖略),名人明星標簽占比最多為133415人。人群星座比例下(圖略),魔蝎座占比最高為12.76%,處女座為11.84%,天蝎座為10.1%。

以上我們通過微博指數對TFBOYS的粉絲進行了分析,現在微博指數輸入“王凱”關鍵詞,得出總體趨勢圖如圖5。

從地域分布看(圖略),其中地域熱議度最高的為北京,占比9.43%,用戶熱議度最高的也是北京為8.37%;在人群屬性分析下(圖略),女性人數最多,為86.94%,男性為13.06%:在年齡分布下,19到24歲人數最多為39.59%,其次為25到34歲,占比31.71%;從標簽比例和星座比例,“名人明星”類標簽最多,星座比例中魔蝎座和獅子座最多,分別占比17.53%和14.63%。

通過以上分析,現在得到明星粉絲人群畫像如下:

TFBOYS粉絲群主要集中在廣東、重慶和北京,粉絲人群中女性占絕大部分,年齡分布主要集中在12到24歲,粉絲人群自我標簽主要為“名人明星”,這代表這部分用戶偏好主要為“名人明星”,星座比例分布較為均勻。

王凱粉絲群主要集中在北京、江蘇、上海和廣東,粉絲人群中女性占絕大部分,年齡分布主要集中在19到34歲,粉絲人群中自我標簽主要為“名人明星”,喜歡王凱的粉絲中星座分布魔蝎座和獅子座最多。

三、用戶畫像與精準營銷

精準營銷依托數據資源和渠道優化的優勢,并結合數字化廣告的營銷傳播渠道,將廣告內容送達目標人群。精準營銷的核心在于直擊有需求的用戶,然后再提供相應的產品和服務,通過這種針對性的營銷,才能夠實現更好的流量轉化率。當獲得了一個話題的用戶畫像信息后,商家就可以根據用戶畫像,對這部分群體進行廣告投放。

通過以上研究,已獲得了明星粉絲的用戶畫像,企業就可以根據用戶畫像制定精準營銷方案。針對TFBOYS和王凱兩位明星,明顯可以看出兩位明星粉絲的人群明顯不同,因此挖掘精確的目標人群成了精準營銷的關鍵所在。首先,企業可以在新浪微博建立品牌與明星相關的話題,話題里需要設置“TFBOYS”或“王凱”這樣的關鍵字;其次,通過網絡爬蟲技術,把參與該話題討論下的用戶信息都收集起來,主要包括該用戶的ID、性別、地域、個人標簽和該用戶過往所發表微博內容;然后,根據微博的關聯關系和該用戶所發表的微博內容進行用戶偏好分析,其中通過關聯關系,可以判斷該用戶微博所關注的人群是否有該話題明星或和該明星相關的用戶,或者通過大數據技術,對用戶所發表微博中,是否有該話題明星的關鍵字,出現的頻率是多少。最后通過數據挖掘得到了精準的粉絲群體。那么精準營銷的最后一步便是廣告推廣,企業可以與新浪微博合作,購買新浪微博的廣告排位進行廣告投放。

在精準營銷中,通過定量或定性地描述企業用戶群體行為特征,為客戶做用戶畫像給現代數字營銷帶來了可能。用戶畫像系統為企業全方位的掌握客戶群體的信息標簽,使企業了解、認知自己的客戶。同時在品牌的傳播與建設中,用戶畫像無疑也是一個不錯的選擇。

參考文獻:

[1]卞友江.“大數據”概念考辨[J].新聞研究導刊,2013,(5):25-28.

[2]許瑾.精準營銷探析[J].信息網絡,2006,(8):26-27.

[3]茹仙古力·艾合麥提.淺談文獻搜索與畢業論文[J].大科技·科技天地,2010,(5):142-143.

[4]尹啟華鄧然.精準營銷研究現狀[J].經濟研究導刊,2010,(9):158-159.

[5]趙暉.互聯網思維下的“粉絲經濟”[J].上海信息化,2014,(6):25-27.

作者簡介:曾 鴻(1964-),成都信息工程大學統計學院教授,研究方向:統計理論、市場調查。

吳蘇倪(1993-),成都信息工程大學統計學院學生。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产sm重味一区二区三区| 免费一极毛片| 成人亚洲视频| 中文一区二区视频| 91人人妻人人做人人爽男同| 欧美在线网| 成人欧美日韩| 69国产精品视频免费| 怡红院美国分院一区二区| 亚洲视频三级| 亚洲人成色77777在线观看| 69av在线| 欧美综合一区二区三区| 欧美激情第一欧美在线| 婷婷六月综合| a毛片免费在线观看| 激情综合五月网| 色婷婷电影网| 九九热在线视频| 亚洲性一区| 国内精品久久久久鸭| 天天躁夜夜躁狠狠躁躁88| 国产91九色在线播放| 亚洲国产第一区二区香蕉| 日韩在线视频网| 久久精品国产国语对白| 99性视频| 香蕉在线视频网站| 免费在线视频a| 亚洲AⅤ综合在线欧美一区| 91免费在线看| 中文无码日韩精品| 日本一区高清| 国产精品视频观看裸模 | 亚洲黄色成人| 精品久久久久无码| a级毛片一区二区免费视频| 欧美a级在线| 97国产在线播放| 国产丝袜一区二区三区视频免下载| 亚洲人成人伊人成综合网无码| 欧美日韩精品一区二区在线线| 日韩av电影一区二区三区四区| 亚洲日韩AV无码精品| 91国内视频在线观看| 日本高清有码人妻| 欧美专区日韩专区| 日韩在线网址| 在线视频亚洲色图| 亚洲丝袜中文字幕| 国产sm重味一区二区三区| 亚洲日韩国产精品综合在线观看| 亚洲AⅤ综合在线欧美一区| 欧美日韩国产高清一区二区三区| 久草视频精品| 国产免费久久精品99re丫丫一| 91精品专区国产盗摄| 亚洲国产综合自在线另类| 日韩精品一区二区三区免费在线观看| 一本视频精品中文字幕| 免费a级毛片18以上观看精品| 欧美一道本| 国产97公开成人免费视频| 国产在线视频福利资源站| 国产99欧美精品久久精品久久| 无码精品一区二区久久久| 亚洲一区二区三区国产精品 | 超碰精品无码一区二区| 亚洲女同欧美在线| 久久人搡人人玩人妻精品 | 国产激情第一页| 美臀人妻中出中文字幕在线| 欧美成人二区| 亚洲欧美精品一中文字幕| 亚洲一区国色天香| 亚洲精选无码久久久| 日韩少妇激情一区二区| 亚洲无码电影| 亚洲色图欧美在线| 国产精品嫩草影院av| 精品撒尿视频一区二区三区| 欧美亚洲国产一区|