高鵬群 鄧建高
[摘 要]在線社交網絡精準營銷是現代營銷理論的重點發展方向。文章以新浪微博用戶作為研究對象,分析用戶微博文本內容信息,創建微博用戶交互內容數據庫。運用復雜網絡分析方法構建加權用戶關系網絡。最后,基于潛在用戶價值分析,采用改進的k-核分解方法實現在線社交網絡新客戶識別。該方法兼顧文本內容信息和用戶影響力因素,精準識別在線社交網絡中的新客戶,實現企業精準化營銷對象發現。
[關鍵詞]k-核分解;在線社交網絡;精準營銷;新客戶識別
[DOI]10.13939/j.cnki.zgsc.2018.17.119
1 引 言
中國已形成龐大的在線社交網絡。2018年中國互聯網絡信息中心(CNNIC)發布的第41次《中國互聯網絡發展狀況統計報告》[1]數據顯示,截至2017年12月,中國網民規模達7.72億,互聯網普及率達到55.8%。網民數量的激增推動了新浪微博、微信等在線社交網絡新媒體平臺的迅猛發展,其對市場營銷和計算廣告產生重大影響。
基于在線社交網絡和大數據的精準營銷將是企業營銷理論發展的方向。一方面,在線社交網絡塑造了全新的社會生活形態,成為產品推廣、營銷互動以及挖掘潛在客戶的重要平臺。低成本、高效率以及個性化傳播等特點,決定了其作為精準營銷手段的巨大潛力。在線社交網絡被認為是現代企業開展高效精準營銷最有效的方法。[2]另一方面,大數據環境下,在線社交網絡平臺保存了大量用戶數據信息,海量數據為目標客戶準確定位提供了強大的支持。面對以“分眾市場”為主要特征的現代市場,消費者需求越來越細分化,企業具備從網絡平臺獲取營銷信息的能力,有助于細分目標市場,識別潛在新客戶。
目前,關于精準營銷的研究主要集中在內涵分析和體系構建等方面。現代營銷大師Philip Kotler首先分析了精準營銷的內涵,他認為企業需要更精準、可衡量和高投資回報的營銷溝通,制定更具針對性的營銷策略。新客戶的精準識別正是企業精準營銷的重要目標,精準營銷的關鍵在于理解目標客戶的行為、愛好與需求,然后將這些信息應用到獲取新客戶的過程中。現有研究多從新客戶的特點和重要性出發,提出了新客戶識別的技術和方法,其成果為精準營銷新客戶識別的深入探究提供了借鑒。然而,現有基于海量數據的精準營銷新客戶識別研究成果較少。在線社交網絡環境下,企業精準營銷新客戶識別的關鍵是找到合適的數據,掌握潛在客戶的情況,特別是影響力大的潛在客戶,并進行精準的歸類與定位。下文以新浪微博用戶為例,采用復雜網絡改進k-核分解法進行新客戶的挖掘。
2 微博文本分析與用戶關系網絡構建
微博作為在線社交網絡主要應用形式,兼具社會網絡和社交平臺的特征,微博已成為企業開展營銷策劃活動的重要平臺。以新浪微博華為榮耀手機相關微博信息為例,其微博內容可分為兩類:一類為華為榮耀手機購買者的微博信息,他們發布的購買以及使用體驗信息對其他用戶產生購買影響,對這部分貢獻現金流的老客戶,企業應深入分析客戶資料,提高客戶關系管理水平,進而提高客戶忠誠度;另一類為華為榮耀手機的潛在購買者的微博信息,他們對榮耀手機有一定的關注,會對相關微博內容進行轉發和推送,他們利用其社會聲望對廣大用戶產生影響,為企業帶來豐富的社會關系和強大的社會影響力,幫助企業識別新客戶。
傳播在用戶間的微博信息蘊含了巨大的營銷價值,然而由于目標群體過于龐大,企業營銷資源有限,亟須縮小范圍,對部分用戶實施更具針對性的營銷策略。一方面,現代企業的發展更看重預期收益,相比于老客戶流失的必然性,新客戶的獲得帶動市場新增長,為企業創造新的市場空間,開發新客戶意義遠大于維護老客戶。另一方面,在線社交網絡的興起,影響力已經成為用戶行為管理和關系形成的關鍵因素,[3]這種社會影響力有利于營銷信息的廣泛傳播,[4]而高影響力的客戶正是新客戶識別的關鍵。[5]潛在購買用戶群體中,尤其是購買意愿強烈且具有廣泛社會影響力的用戶將是精準營銷的重點客戶。
2.1 微博信息的抓取與整理
基于新浪微博數據平臺,通過八爪魚采集器爬取了27023條華為榮耀手機潛在用戶的微博信息,共956名微博用戶。將采集到的微博信息進行分類整理,建立微博用戶交互內容數據庫。采集到的榮耀手機微博信息主要包括以下六個方面:一是微博信息發布者;二是微博文本信息;三是微博轉發者;四是微博評論;五是微博推送對象;六是微博轉發和推送次數。
2.2 微博內容文本分析
在新浪微博中,華為榮耀手機關注者對該產品的相關意見和觀點直接反映了用戶對產品的態度以及購買意愿。結合詞典,基于R語言軟件中的Rwordseg、jiebaR等程序包編寫代碼,對抓取到的微博文本內容進行分詞處理,剔除停用詞和頻率較低的特征詞,最終實現文檔分詞。[6]然后提取與榮耀手機相關的關鍵評價詞,由于用戶購買意愿程度不同,因而對產品的評價褒貶不一,按照購買意愿程度將評價詞由強到弱分為五類,依據評價詞賦予原微博文本內容發布者或評論者不同等級的評分(用δ表示),如表1所示。
鑒于用戶可能發布或評論多條微博內容,文本內容亦可能包含多個評價詞,因此,對用戶所被賦予的所有評分取平均值(若不為整數則向上取整)作為該用戶的最終評分值。用戶直觀分類使得企業可以有針對性地識別出潛在消費用戶。
2.3 構建加權用戶關系網絡
分析微博平臺的特征、微博用戶間轉發和推送行為可以很好地表示用戶之間的信任關系及親密程度。下文依據前文所建微博用戶交互內容數據庫,通過轉發和推送行為,構建加權用戶關系網絡。其中,用戶關系網絡中的節點代表微博用戶,節點間有邊相連,邊即社會連帶,指通過分享經驗或交流信息而產生的互動關系。邊上的權值表示用戶間聯系的緊密程度,權值越高,則表示聯系越緊密。借鑒復雜信任網絡構造理論,[7]用戶間關系權值可由式(1)計算:
wij=[SX(]α[JB((]N(r)i,j+N(r)j,i[JB))]+β[JB((]N(m)j,i+N(m)i,j[JB))][]Ni+Nj[SX)](1)
其中:r表示轉發行為,m表示推送行為;Ni,j表示用戶i和用戶j之間轉發和推送的互動次數;Ni表示用戶i發起的行為次數;α與β為權重因子,分別表示轉發行為與推送行為的權重。由于推送微博信息中常含有用戶不感興趣的信息,因而賦予轉發行為較高的權重,取α=0.6,取推送行為權重β=0.4。下文結合榮耀手機的營銷推廣信息,集中選取數據庫中30名微博潛在用戶,根據用戶關系權值公式,構建用戶加權網絡,如圖1所示。
圖1 用戶加權網絡圖情況
3 在線社交網絡關鍵節點k-核挖掘算法
關鍵節點挖掘,即復雜網絡中最廣泛傳播影響節點發現問題,已成為目前最具研究價值的領域之一,[8]其目的是挖掘復雜網絡中最具信息傳播影響力的節點集合。[9]該問題是一個優化問題,并且已經被證明是NP-難的。[10]關鍵節點研究應用領域極廣,學者們從不同的實際問題出發設計出各種各樣的算法。Kitsak等學者通過研究表明,在信息傳播影響力方面,核數比度數和介數等節點屬性更為有效地刻畫了節點的傳播效率,并認為信息傳播更穩健的節點是根據k-核分解算法求得處于網絡中心的節點。[11]k-核分解算法對于識別復雜網絡傳播動力學中最關鍵節點具有重要價值。[12]
k-核分解法計算復雜度低,在分析大規模網絡層級結構等方面應用廣泛。近幾年不少學者受到這種思想的啟發,對k-核算法進行了擴展改進,使之應用范圍更廣,準確性更好。曹久新等學者考慮節點影響區域的重疊問題,提出核覆蓋算法(CCA),該算法在核數相同的情況下,考慮了節點的度數屬性,確保傳播節點可以更大程度上影響網絡中的其他節點。[13]
4 在線社交網絡新客戶識別
微博中最具影響力的少數用戶所發微博很快就能傳遍整個網絡,[14]這些用戶的挖掘是企業微博精準營銷的關鍵。用戶關系網絡中新客戶的挖掘,類似于復雜網絡中關鍵節點的篩選。此類關鍵節點一般數量不多,但其影響卻能夠迅速波及網絡中大部分節點。[15]在信息傳播功能背景下對節點角色區分和排序,挖掘具有“消息引爆能力”的關鍵節點,可以應用于市場營銷和廣告投放策略的研究中。[16]企業通過在線社交網絡平臺進行營銷推廣過程中,精準營銷下的新客戶對企業的產品最可能做出積極回應并表現出強烈購買意愿;[17]同時,他們具有廣泛的社會影響力,能夠對其他用戶產生影響,為企業發展規模龐大的潛在消費者群體,最終給企業帶來豐富利潤。
4.1 新客戶價值計算
基于微博文本信息和用戶行為信息,精準營銷新客戶價值包括用戶本身對企業產品的強烈購買意愿以及用戶為企業帶來的高社會影響力價值。以此為依據,結合Wei等學者關于k-核分解加權度的改進計算,[18]進行在線社交網絡下精準營銷新客戶的挖掘,其計算方法如下:
4.2 基于k-核分解的新客戶挖掘過程
基于已構建好的加權用戶網絡(見圖1),按照經典k-核分解算法對網絡進行分解,結果如圖2所示。
圖2 用戶加權網絡k-核分解圖情況
節點核數從外至里依次是1,2,3,4,其分布呈層次結構。依據用戶微博文本信息,對照購買意愿賦分表,由式(4)計算新用戶價值,對圖3中已分層的用戶網絡進行精準營銷新客戶的挖掘。考慮到用戶節點的廣泛影響能力及影響區域重疊問題,選定用戶節點后,標識其所有鄰居用戶節點為信息傳播的覆蓋狀態,覆蓋狀態下的用戶節點將不再考慮。初始階段,每個節點都處于未覆蓋狀態,每步在當前核數最大并且未被覆蓋的節點中選定價值最大的節點用戶作為精準營銷新客戶。
首先,考慮核數最大的用戶節點集合,選取其中用戶價值最大的節點。核數為4的用戶節點計算數據如表2所示。
由表2得知,用戶節點B20的用戶價值為最大值144,因此選定用戶節點B20為精準營銷新客戶。同時,標識用戶節點B20所有鄰居節點的集合{B13、B14、B15、B19、B23、B24}為信息傳播覆蓋狀態;其次,重復第一步,挖掘得到用戶節點B18、B11和⑧;最后,考慮到小核值用戶節點的影響能力相對較弱,當用戶節點③選定后,對剩下核值為1的用戶節點不再進行精準營銷用戶節點的挖掘。綜上所述,精準營銷用戶節點集合為S={B20、B18、B11、⑧、③}。
對企業來說,精準營銷目標客戶群體確定后,企業可以集中資源,采取各種精準營銷手段對上述集合S中的用戶進行高效營銷推廣,最終實現企業精準營銷目標。
5 結 論
文章兼顧微博文本內容與用戶影響力,探索了基于復雜網絡k-核分解算法的在線社交網絡精準營銷新客戶識別方法,為今后的研究提供理論和實踐參考。理論方面,對復雜網絡關鍵節點挖掘的k-核分解算法進行了擴展和改進,并運用到精準營銷新客戶識別的研究中。該方法可以準確、快速地挖掘出企業精準營銷所需新客戶;實踐方面,在線社交網絡的普及和低成本特性使得企業可以通過媒體平臺精準快速地識別新客戶,擴大企業市場占有率,提高經濟效益。同時,在線社交網絡新媒體平臺上產生了大量的用戶文本信息,這些文本內容的商業化和價值化使得微博、微信等平臺具備了成為強有力營銷工具的潛能。
此外,復雜網絡作為描述自然界和人類社會各種復雜系統的有力工具,目前已廣泛應用于社會科學、生命科學和信息科學等領域。在線社交網絡屬于典型復雜網絡問題,它的發展優化了大數據時代海量信息的共享、推薦和挖掘。運用復雜網絡技術手段開展在線社交網絡精準營銷研究將是未來研究工作的重點。
參考文獻:
[1]中國互聯網絡信息中心(CNNIC).第41次《中國互聯網絡發展狀況統計報告》[EB/OL].(2018-01-31).http://www.cac.gov.cn/2018-01/31/c_1122346138.htm.
[2]L PEI,Z YINI,Q F,et al.Information Diffusion in Structured Online Social Networks[J].Modern Physics Letters B,2015,29(13):65-76.
[3]Z ZHIGUO,S JINGQIN,K LIPING.Measuring Influence in Online Social Network Based on the User-content Bipartite Graph[J].Computers in Human Behavior,2015(52):184-189.
[4]ALFALAHI K,ATIF Y,ABRAHAM A.Models of Influence in Online Social Networks[J].International Journal of Intelligent Systems,2014,29(2):161-183.
[5]KUMAR V,PETERSEN JA,LEONE RP.How valuable is word of mouth?[J].Harvard Business Review,2007,85(10):2-9.
[6]伍萬坤,吳清烈,顧錦江.基于EM-LDA綜合模型的電商微博熱點話題發現[J].現代圖書情報技術,2015(11):33-40.
[7]唐曉波,孫飛.基于復雜信任網絡的社會化媒體好友推薦研究[J].情報理論與實踐,2015,38(11):96-102.
[8]L JIANHONG,G QIANG,D WENZHAO,et al.Identifying the Node Spreading Influence with Largest K-core Values[J].Physics Letters A,2014,378(45):3279-3284.
[9]方濱興.在線社交網絡分析[M].北京:電子工業出版社,2014:365-368.
[10]許宇光,潘驚治,謝惠揚.基于最小點覆蓋和反饋點集的社交網絡影響最大化算法[J].電子與信息學報,2016,38(4):795-802.
[11]MAKSIM K,LAZAROSK G,SHLOMO H,et al.Identification of Influential Spreaders in Complex Networks[J].Nature Physics,2010(11):888-893.
[12]任卓明,劉建國,邵鳳,等.復雜網絡中最小K-核節點的傳播能力分析[J].物理學報,2013,62(10):474-479.
[13]曹玖新,董丹,徐順,等.一種基于k-核的社會網絡影響最大化算法[J].計算機學報,2015,38(2):238-248.
[14]WENG J,LIM E P,JIANG J,et al.Twitterrank:Finding Topic-sensitive Influential Twitterers[M].Proceedings of the Third ACM International Conference on Web Search and Data Mining.New York:ACM Press,2010:261-270.
[15]ALBERT R,JEONG H,BARABASI A L.Error and attack tolerance of complex networks[J].Nature,2000(406):378-382.
[16]任曉龍,呂琳媛.網絡重要節點排序方法綜述[J].科學通報,2014(59):1175-1197.
[17]CUI G,WONG ML,WAN X.Targeting High Value Customers while Under Resource Constraint:Partial Order Constrained Optimization with Genetic Algorithm[J].Journal of Interactive Marketing,2014(29):27-37.
[18]WEI B,LIU J,WEI D,et al.Weighted K-shell Decomposition for Complex Networks based on Potential Edge Weights[J].Physica A:Statistical Mechanics and its Applications,2015(420):277-283.