王 英
(宿州學院 信息工程學院,安徽 宿州 234000)
?
微信數據挖掘的研究
王英
(宿州學院信息工程學院,安徽宿州234000)
摘要:微信是目前手機上最常用的一款社交工具.微信每天都會產生大量真實的個人信息,如何把這些信息運用于商業中?本文主要介紹了,基于微信產生的這些大數據進行數據挖掘的應用可用于哪些方面.可以進行客戶關系管理、關系鏈管理、實時的線下商家搜索、數據智能分析和決策指導、基于用戶行為的精準推薦、福媒體應用等可供研究的方向.
關鍵詞:微信;數據挖掘;大數據;人類行為
巴拉巴西,復雜性科學最富盛名的國際領軍人物,在他著名的書《爆發》中,介紹了一整套理解人類行為時空模式的觀念和理論,他提出“人類很多行為遵循一些統計規律,人類行為93%是可以預測的”.
對人類行為觀測和預測進行應用的典型的例子是:在1972年倪匡寫的《規律》一書中,描寫了特務機構長期跟蹤康納士博士拍攝了6個多小時的日常生活影片,郵寄給他,并繪制了他的日常生活曲線圖,他的日常生活曲線圖和馬蜂的是一致的,使他覺得生活沒有意義繼而自殺.康納士自殺的事件轟動了世界,后來經調查發現其原因就是那張行為分析曲線圖!
這些都說明人類的行為是可以預測的,在現在這樣一個信息時代,每天都有大量的數據產生,也有大量的數據被記錄,如何應用這些數據呢?
2.1大數據
大數據是目前很受觀注的一個詞,其數據的內容隨著互聯網技術﹑移動互聯網技術的發展,變得越來越豐富,這些數據數量巨大﹑類型眾多﹑結構復雜,通過數據的整合共享,交叉復用,通過計算機技術的處理,形成的智力資源和知識服務能力其應用前景是巨大的.大數據的4V特點是:Volume(大量)﹑Velocity(高速)﹑Variety(多樣)﹑Veracity(真實).
在互聯網行業的大數據應用于企業服務的現狀是:針對互聯網用戶數據的分析﹑挖掘﹑使用的產品越來越多,應用的方向是:
1.用來做自身產品推廣,如:美麗說﹑蘑菇街等;
2.依靠用戶關系迅速發展用戶,如:應用新浪微博進行客戶推廣的“啪啪”等.
2.2移動互聯網的大數據
用戶可以通過不同的終端,如PAD﹑手機或其他各種移動式終端接入到互聯網里.隨著接入用戶的增多和用戶使用時間的增長,不斷地產生豐富的信息,如文本﹑圖片﹑語音﹑視頻等,這些移動互聯網產生的數據真實的反映了用戶的生活軌跡.豪無疑問,這樣的信息價值更大,比如在PC互聯網上用戶之間是陌生的,相互之間不知道對方是誰,而到移動互聯網時代,彼此之間的信息是真實的,陌生感消除.
因此移動互聯網上的大數據相比PC互聯網的大數據具有以下幾個特征:
1.數據的源頭是人﹑人使用的終端,而不再是網頁或ID;
2.帶有準確的地理位置信息;
3.動作更加具有實時性;
4.行為更加零散化;
5.數據準確性更高.
微信上聚集了移動互聯網上最多的用戶,目前有很多第三方運營商對微信進行二次開發,在他們產品中也有一些微信數據挖掘的簡單應用,他們可以更充分地利用微信數據挖掘,開發出更好的產品.從而更好的應用微信帶來的大數據,為應用服務.本文介紹了對微信數據挖掘的研究.
微信的發展非常迅速,目前已有7億多用戶,他們通過微信的各種功能,時刻地產生大量的數據.很多人每天花在微信上的時間累計起來超過兩小時以上,他們可以在微信上做很多事情:
1.通過微信和好友﹑同事聯系,還可以和微信中的陌生人聯系;
2.刷朋友圈看看大家分享了些什么好文章,查看自己感興趣的公眾帳號,閱讀相關咨詢;
3.如果正在享受美食美景,可能會將這份美好拍攝下來,分享到朋友圈,這些信息帶著地理位置等等.
在目前這種微信的用戶數量和用戶數據積累快速增加的情況下,它越來越貼近騰訊公司最初開發時的想法——一個個人信息數據中心.這種個人信息是真實的,不像PC互聯網上出現的如水軍﹑機器等產生的垃圾信息的干擾,所以微信的大數據是非常有價值的.
微信的功能類似于QQ,是騰訊公司為手機用戶而開發的,產生的數據一定程度上能夠準確地反映用戶的個人信息,當微信數據加入后將直接開啟O2O通道,如此巨大的數據該如何挖掘,如何應用,可以有以下幾個方向:
4.1客戶關系管理
微信公眾平臺可作為小商家的初級CRM(客戶關系管理系統)來使用.使用第三方公司開發的微網站的制作會員卡功能,收集客戶信息﹑統計客戶信息,非常方便.最重要的是,客戶挾帶也方便,不會遺忘在家里.
4.2關系鏈管理
微信通訊錄中有家人﹑好友﹑同事﹑客戶等社會關系,還有“搖一搖”等方式加入的陌生人,另外還有微信群﹑公眾賬號等,如何利用這些有效的關系鏈資源,挖掘有效信息,是數據挖掘工作可以做的.
4.3數據智能分析和決策指導
目前為商家做數據分析的,比如淘寶就有淘寶店鋪的數據分析功能,讓賣家掌握銷售情況.有了微信用戶數據后就不只是提供這些了,甚至可以幫助商家進行經營決策.這種決策類似于人工智能的應用,依據的是微信中的數據.
4.4實時的線下商家搜索
目前微信“查找附近的人”功能里就可以搜索到微信會員卡商家.這是個很好的O2O入口.騰訊公司已宣布,保持微信的開放性,很多的第三方開發者,比如微盟等制作了功能豐富的微信二次開發平臺,提供管理標準和支付環節,大量的線下資源可以通過各個第三方應用對接進入,微信必將成為中國最大的O2O平臺.
4.5基于用戶行為分析的精準推薦
現在所謂的“垃圾短信”﹑“垃圾郵件”,還被很多商家廣泛使用著.其實這些信息本身是有價值的,只是收到的人并不需要這些信息所以成了垃圾,而現在通過對微信用戶行為數據進行分析后,就可以實現給需要的人發送需要的信息.客戶獲得的信息正是他們所需要的,提高了發送信息的預期效果.
4.6富媒體應用
例如:微信的“微語音”插件,具有變聲功能,給用戶的使用帶來了極大的趣味性.比如制作圖文混排﹑加入視頻﹑音頻模板的功能,有點像PowerPoint,但是微信的功能要更強大,因為后臺還可以做數據分析.
微信公眾平臺在微信5.0增加了用戶訪問量與圖文閱讀量的統計功能,這些功能的使用對微信的商業應用更具價值.
5.1用戶訪問量的統計
微信的用戶分析功能包含用戶增長和用戶屬性兩部分,前者通過圖形和數據量化每日的關注用戶增減信息,后者則依據關注用戶的設置細分地區﹑性別﹑語言等信息并給出統計.用戶訪問量的統計,如圖1所示:

圖1 用戶訪問量統計
5.2圖文閱讀量的統計
圖文分析功能包括圖文群發與圖文分析兩部分,前者針對每日推送的各篇文章的打開﹑原文閱讀和轉發的具體數,后者則以每日為單位統計總打開量﹑原文閱讀以及轉發量.
5.3消息分析功能
消息分析功能則是詳細統計每日又關注用戶發來的消息次數與人數等數據.
事實上,微信公眾平臺原本就提供部分數據顯示和統計功能.例如關注人數的增加和減少等信息,一直都是微信公眾平臺上的常規顯示數據.本次的數據統計功能實際上是對原有功能的大幅度強化.
數據的公開和量化是本次公眾平臺功能升級的根本意義,這一改變帶來的直接影響是對各類微信代運營﹑微信推廣與營銷業務提出了更高的挑戰.”在此之前,由于無法查看每日推送(針對推送賬號而言)的實際打開數據,各方僅能憑借推送內容的好壞以及推送賬號的關注用戶數量來進行反推算,因此無法為各項營銷服務的品質提供準確的量化依據.
在這個移動互聯網快速發展的時代,手機記錄了豐富的個人信息.巴拉巴西寫的書里反復強調的就是人的行為是可以預測的,而來源就是大數據.微信的數據挖掘可以為我們做這件事!商業數據的可量化無疑將進一步提高微信平臺的商業價值.
需要注意的是,在這個大數據快速發展的時代,其弊端在于用戶隱私被惡意泄露﹑用戶被騷擾等隱憂.但是騰訊公司在這方面已做出了保證,把資源開放給所有的移動開發者的同時,建立很好的管理機制,而不是對用戶信息不負責任的使用,做到對用戶有益﹑對平臺有益﹑對開發者有益.
參考文獻:
〔1〕[美]Anand Rajaraman,[美]Jeffrey David Ullman.大數據:互聯網大規模數據挖掘與分布式處理[M].北京:人民郵電出版社,2012.92-95.
〔2〕邱洋.微博數據提取及話題檢測方法研究[D].大連:大連理工大學,2013.9-10.
〔3〕尹子斌.基于微博用戶行為的數學建模和數據分析[D].上海:上海交通大學,2013.20-21.
〔4〕佚名.http://www.poluoluo.com/jzxy/201211/185955_2.htm[EB/OL],2012.11.
〔5〕馮典.面向微博的數據采集和分析系統的設計與實現[D].北京:北京郵電大學,2013.24-38.
基金項目:宿州學院智能信息處理實驗室開放課題,基于微信二次開發的智能信息處理(2014YKF42)
收稿日期:2015-10-24
中圖分類號:TP311.5
文獻標識碼:A
文章編號:1673-260X(2016)03-0035-02