徐翔斌,涂 歡 ,王佳強
(1.華東交通大學機電工程學院,江西南昌330013;2.中南大學交通運輸工程學院,湖南長沙410075)
SNS(social network site,社交網站),指幫助人們建立社會性網絡的互聯網應用服務,而近來異?;鸨奈⒉┮彩菍儆赟NS的一種。已有學者對SNS商業價值進行了較為深入的研究,王璐[1]提出了SNS的4種網絡營銷模式,口碑營銷、植入式營銷、病毒式營銷和邀請營銷,并對SNS網絡營銷的前景進行了展望。邢相軍,賈元斌等[2]則指出SNS除了其在廣告,增值服務和網頁游戲等方式外,電子商務與SNS的聯姻更能體現它的價值,并探討了SNS模式特點下的電子商務網站的發展。連環[3]指出,SNS的社會性、開放性、互動性等特征使其在企業信息化建設中具有重要的作用,在探討企業實體所涉及關系的基礎上,闡述SNS在企業內部知識管理、客戶關系管理以及企業精準營銷等方面的應用,為企業的信息化建設提供指導意義。
但到目前為止,對SNS客戶進行價值評估研究不多,更沒有利用復雜網絡理論。本文在相關研究的基礎上,以微博為例,利用復雜網絡,客戶關系管理、市場營銷等理論,建立一套完整的微博客戶價值評價體系和用戶價值評價模型。
復雜網絡不同于完全規則網絡和完全隨機網絡,具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡稱為復雜網絡[4-5]。微博用戶網絡作為SNS的一種也屬于復雜網絡。它是基于WEB2.0平臺新近興起的一類開放互聯網社交服務。它與傳統的社交網站(social network sites)一樣都是基于“六度分割”的概念[6]。此概念是指任意兩個陌生人都可以通過人際關系找到對方從而使每個人的社交范圍可以不斷擴大。微博讓用戶之間形成一張無形的大型社會化網絡,該網絡中的節點代表用戶,邊表示用戶之間的相互聯系。當處在該網絡中某一個用戶產生一個動作,就會傳遞到網絡中與之關聯的其他用戶。如果其他用戶有所反應,同樣會不斷擴散到與該用戶關聯的其他用戶。如此下去,就會不斷擴散到整個網絡,永無休止地進行傳播,從而形成一種“蝴蝶效應”。
微博這種用戶關系和信息傳播作為一種新的信息渠道,為客戶關系管理提供了新的思路和方向。雖然微博具有用戶信息真實、用戶定位清晰、用戶關系網絡化、用戶黏性強等特點,然而其用戶關系具有隱蔽性、關聯性、動態性、瞬時性和涌現性等特征,與傳統的客戶關系有很大的不同。以客戶獲取為例[7],獲取微博中的關鍵客戶即可獲取該網絡中與之關聯的其他客戶,而傳統的客戶關系管理則需要逐個獲取客戶,如圖1、圖2所示,可見傳統的客戶關系管理理論和方法在這里遭遇到瓶頸。

圖1 微博客戶獲取Fig.1 Microblog customer acquisition

圖2 傳統客戶獲取Fig.2 Traditional customer acquisition
本文運用復雜網絡理論來對微博用戶網絡進行評價分析,并致力建立一個微博用戶的客戶價值模型。下面首先介紹下復雜網絡中重要的客戶評價指標。
微博用戶網絡節點數量龐大,節點之間關系明確,每個用戶代表網絡中的一個節點,邊代表用戶之間的關系。
1)度指標。度指標(degree centrality)用于描述在靜態網絡中節點所產生的直接影響力,其值為與該節點直接相連的節點數。對于加權網絡,一個節點的度D(i)是與它的邊緣時間相應的所有價值的總和。在這兩種情況下,其數學表達式如公式(1)所示

其中:g是指網絡節點的最大值;Xij表示節點i到節點 j的度。度指標定義表明節點與其他節點直接通訊能力的越強,其重要性越強。它適合研究節點的直接影響力,但只能測試網絡沒有重復鏈接的情況。
2)緊密度指標。緊密度指標(closeness centrality)用于刻畫網絡中的節點通過網絡到達網絡中其他節點的難易程度,其值C(i)定義為該節點到達所有其他節點的距離之和的倒數。其數學表達式如公式(2)所示

其中:g是指網絡節點的最大值;δij是指節點i到節點 j的最短距離。緊密度指標考慮了節點間通訊的獨立性,即與其他節點通訊的可能性對通訊所需中間媒介的最少個數的依賴程度。它可以用于研究信息在最短路徑中傳播及信息并行復制的情況,它的鏈路只會被使用一次,且易于在最短路徑上向整個網絡擴散。

3)介數指標。介數指標(betweenness centrality)刻畫了網絡中的節點對于信息流動的影響力。其數學表達式B(i)如公式(3)所示其中:gjk(i)表示節點 j和節點k之間的最短路徑數;gjk(i)表示節點 j和節點k之間經過節點i的最短路徑數。介數指標是用于刻畫動態網絡中節點被經過的次數,所以它可以用于信息在最短徑中傳播及信息連續復制的情況[8-9]。
單一化的評價指標往往存在它的不確定性,為了更加合理地評價微博客戶價值,度指標、緊密度指標和介數指標這3項參數往往結合起來使用,在這里,我們就同時利用以上3個指標來進行客戶評價。
1)計算客戶的度指標,在微博客戶網絡中,度指標能最直接的體現客戶對網絡中其他客戶的直接影響力。
2)計算客戶的緊密度指標,在微博客戶網絡中,緊密度指標體現了客戶通過整個網絡對其他客戶的間接影響的能力。
3)計算客戶的介數指標,在微博客戶網絡中,介數指標體現了客戶對整個網絡中信息流動的影響力。
如果網絡中的一個客戶同時具備較大的度指標、緊密度指標以及介數指標,則該客戶在網絡中必然具有較大的影響。相應的,該客戶就是客戶關系中的關鍵客戶。
為了用數學語言描述出網絡中節點的價值,本文建立的了一個數學模型。
設網絡中共有n個客戶,分別用x,y,z來表示每個客戶i的度、緊密度和介數指標。則網絡中客戶的平均度、平均介數和平均緊密度指標則分別為
則客戶i的價值指數如公式(4)所示

式中:α,β,γ分別表示客戶對其他客戶的直接影響力、客戶對其他客戶的間接影響力和對網絡信息流動影響力在評價客戶價值中所占的權重。
本文在評價客戶價值時,同時考慮度、緊密度和介數指標進行綜合評價,并認為在評價過程中這3個指標所占的權重是同等重要的。故可以認為α=β=γ,且另他們的值為1,則最后客戶i的價值指數Qi如公式(5)所示

式(5)即為評價客戶價值的數學表達式。本文從新浪微博上采集了部分數據,并利用該數學模型對所采集數據進行分析。
本文的數據都來源于新浪微博,由于微博用戶數量巨大,只能對其進行采樣。采用的方法是雪球抽樣[10]。具體實施是,先選擇微博中單一的用戶,然后就是該用戶所有的關注對象和粉絲被選取,接著所有被選取用戶的關注對象和粉絲再被選取。這個過程一直持續到抽樣的用戶數量滿足要求為止。這些在第n次被選取的用戶集合被稱為第n層,n同時也就是自中心網絡的半徑。由于關鍵用戶(有很多鏈接的用戶)的高關聯度,這種滾雪球抽樣方法將能在很短時間內獲得這些關鍵用戶。因此,初始用戶是否是關鍵用戶不會再描述這個抽樣的網絡時產生顯著差異,同時也保證了所采集到的數據能夠反映總體微博網絡的特點。
本文設計了專門采集微博用戶數據的網絡蜘蛛,采集起止時間為2011年8月8日至2011年8月19日,共計12天,總共采集到的數據中包含52 990個用戶和1 109 826條表示個用戶間關系的邊,共同構成了一個龐大的網絡。
本文利用Pajek軟件來對搜集到的數據進行分析,Pajek軟件是可以處理結點數大于100萬的大型網絡,同時具有網絡分析和可視化功能的軟件。在數據分析前,先對數據進行些處理,在搜集到的用戶數據中,有部分用戶是屬于不活躍用戶,甚至是“僵尸”用戶,這些用戶注冊了賬號后,長時間沒有任何動作,把近3個月內沒有任何動靜的用戶剝離出來,經過篩選,總共有1 210個“僵尸”用戶,去除掉這些用戶后,得到的新數據總共包含51 780個用戶節點。需要說明的是,這些“僵尸”用戶基本都處于復雜網絡的最邊緣,且這些用戶的關注對象和粉絲數量都非常少,即網絡中它與其他節點之間的有向邊的數量都很少。所以,不用擔心去除這些用戶后對這個網絡的完整性造成影響。
1)平均路徑長度。平均路徑長度(average path length,APL),經過計算,該網絡的APL為4.123。也就是說該網絡中任意兩個用戶之間的平均距離只有4.123。可以看到,這一數值大大低于完全隨機網絡。而APL小于6,也符合六度分離理論。這表明該網絡傳遞信息的能力非常強。
2)集聚系數。集聚系數(clustering coefficient),經過計算,該網絡的集聚系數為0.169。而這一數值要比完全隨即網絡中的集聚系數要大的多,這說明了該網絡中的“物以類聚,人以群分”的特點。
3)度指標。該網絡中總共包含51 780個用戶,而經過計算各節點總度總數為1 097 736。每個用戶的平均度為21.2。而統計結果表明,在該網絡中,用戶度小于20的用戶占據節點總數的76%,而用戶度大于100的用戶占總用戶數的不到5%。因此,該網絡中只有少數用戶擁有較大的度數,大部分用戶的度數都較小,且度分布服從冪律分布。
經過對以上3個指標的分析,發現該網絡有著較短的平均路徑長度和較大的集聚系數,度分布函數符合冪律分布,表明微博屬于典型的無尺度復雜網絡。
利用式(5)可以計算微博網絡中每個客戶的價值系數,這是在認為α=β=γ的情況下得到的結果。但在實際情況下,面對不同的產品、不同的客戶α,β,γ的取值也會隨之浮動。
而在目前一些企業在利用微博進行產品宣傳時,都是盲目的找一些粉絲數量大的名人來進行宣傳,但大部分時候,這種策略往往并不是最優效果的。這是由于整個網絡中存在著“富人俱樂部特性”和“異配性”。這在我們所采集的數據當中也體現的很明顯,下面就根據所采集的數據來說明這兩個特性,對企業利用微博進行產品營銷和客戶關系管理時所造成的影響。
所謂“富人俱樂部”特性,是指網絡中少量的節點具有大量的邊,這些節點也稱為“富節點(rich nodes)”[11],它們傾向于彼此之間相互連接,構成“富人俱樂部(rich-club)”。從采集的數據來看,也恰恰如此,網絡中度指標大于100的節點寥寥無幾,而這些節點之間卻又連接緊密,雖然這些“富節點”掌握著大量的粉絲,但并不意味著,這些富節點就掌握了網絡中的“話語權”。這是由于“異配性”[12]的存在,即一個節點的度越高,其鄰居的平均度越低,從采集數據也能驗證這一點,那些節點度最大的點的鄰居節點的度大大低于整個網絡的平均度??梢娺@種盲目的策略是很難達到預期的效果的,下面就面對不同產品、不同的客戶是采取何種對應策略,α,β,γ權重的取值提出建議。
策略1:當目標客戶群非常明確時,則主要看中度指標,即α取更大的值,例如要在微博網絡中進行數碼產品的推廣,那么我們主要找到那些粉絲最多的數碼類產品微博,即度指標最高的用戶,而此時緊密度和介數指標相對不太重要。
策略2:緊密度主要是決定信息在網絡中傳遞的速度,因為緊密度越高的點,信息能在網絡中實現并行復制,所以他的速度是最快的。當企業的某種新產品上市,而其產品相對于競爭對手的同類產品的差異化不大,即容易被其他產品替代時,為了迅速擴大產品影響,獲得口碑,那么產品信息的傳播速度此時是最重要的,則主要看中緊密度指標,即β取更大的值,而此時度指標和介數指標相對不太重要。
策略3:介數指標主要決定信息在網絡中傳播的廣度,介數指標越高的點,網絡中信息經過該點的幾率越大,所以介數越高的點,越有利于信息傳播的范圍更廣。當企業的某種產品具備足夠強的競爭力,市場上無其他同類產品對其構成威脅,此時,企業的宣傳策略就是要讓更多的用戶知道他的產品,則主要看中介數指標,即γ取更大的值,而此時度指標和緊密度指標相對不太重要。
建立以上客戶價值評價模型的意義在于可以指導企業在利用微博進行產品營銷和客戶關系管理時,針對不同類型的產品,有的放矢,選擇正確的策略、適當的客戶,這可以大大提高企業的效率和降低企業的成本。
本文利用復雜網絡理論對微博客戶網絡進行了分析,并通過設計網絡蜘蛛抓取新浪微博系統的用戶數據,通過建模和數據分析后得到以下結論。
1)微博用戶網絡具有較短的平均路徑長度,較大的聚集系數和度分布服從冪率分布等典型的復雜網絡特征。
2)建立了基于度、介數及緊密度指標的微博客戶價值綜合評價模型。
3)提出了在企業在實施微博營銷,針對不同產品,不同的客戶差異化運營策略。
本文的研究結論可以為企業實施基于類似微博的網絡營銷提供決策指導和運營參考。
本文僅對微博用戶價值評價進行了初步的實證研究,但對微博客戶關系的動態演化及其動力學特征并未涉及,并未考慮用戶的發言數量和活躍程度,而這也是研究微博客戶關系的關鍵之一,今后的研究可以就此展開。
[1]王璐.淺談基于SNS的網絡營銷[J].經貿論壇,2010,7(8):83-84.
[2]邢相軍,賈元斌.SNS模式下的電子商務網站發展探索[J].生產力研究,2010,8(2):115-116.
[3]連環.SNS在企業信息化中的應用研究[J].應用研究,2010,4(1):63-65.
[4]ALBERTLASZLO BARABASI,EEIC BONABEAU.Scale-free networks[J].ScientificAmerican,2003,288(5):50-59.
[5]WATTS DJ,STROGATZ SH.Collective dynamics of‘small-world’networks[J].Nature,1998,393(6):440-442.
[6]MILGRAM S.The small world problem[J].Psychol Today,1967(6):62-67.
[7]段楠楠.電子商務企業客戶關系的預測與動態管理[J].華東交通大學學報,2010,27(1):119-124.
[8]王林,戴冠中.復雜網絡的Scale-free性、Scale-free現象及其控制[M].北京:科學出版社,2009:107-111.
[9]汪小帆,李翔,陳關榮.復雜網絡理論及其應用[M].北京:清華大學出版社,2006:55-56.
[10] SANG HOON LEE,PANJUN KIM,HAWOONG JEONG.Statistical properties of sampled networks[J].Physical Review,2006,273(1):1-7.
[11]ZHOU S,MONDRAGON R J.The rich-club phenomenon in the Internet topology[J].IEEE Communication Letters,2004,8(3):180-182.
[12]ZHOU S,MONDRAGON R J.Accurately modeling the Internet topology[J].Phys Rev E,2004,7(6):104-108.