摘要:"通過分析短視頻網站的視頻轉發數據,提出一種用戶個體影響力的判斷和計算方法,進行了活躍用戶群體的轉發特征統計實驗,對分析電商用戶行為和社交輿情傳播具有重要意義。結果表明,高影響力和低影響力個體的粉絲數和追隨者數量幾乎沒有相關性;當影響力達到一定值時,粉絲和追隨者的數量具有強相關性;高影響力的用戶轉發相同短視頻的頻率一般都比較低,其轉發對象的分布律一般較高。與粉絲互動的頻率因個人認證名人用戶、企業、媒體機構和其他認證用戶的需求而異;當短視頻形成廣泛傳播趨勢時,轉發數量非常接近評論數量,甚至顯著超過評論數量,而對評論的答復數量與個人影響力之間沒有顯著相關性。
關鍵詞:個體影響力""群體行為""關注者"""粉絲"""傳播行為特征
中圖分類號:TP393.092
Research"on"the"Dissemination"Behavior"Characteristics"Analysis"and"Influence"Judgment"Methods"Based"on"Followers'"Contribution"Quantification
HUANG"Haojing""LU"Fei""CAO"De’an
Guangdong"Open"University(Guandong"Polytechnic"Institute),"School"of"Engineering"and"Technology"Guangzhou,"Guangdong"Province,"510091"China
Abstract:"By"analyzing"video"forwarding"data"from"short"video"websites,"this"paper"proposes"a"method"to"assess"and"calculate"the"individual"influence"of"users,"conductes"a"statistical"experiment"on"the"forwarding"characteristics"of"active"user"groups,"which"is"of"great"significance"for"analyzing"e-commerce"user"behavior"and"social"public"opinion"dissemination."The"results"reveal"that"there"is"virtually"no"correlation"between"the"number"of"fans"and"followers"of"individuals"with"high"or"low"influence;"When"the"influence"reaches"a"certain"threshold,"there"is"a"strong"correlation"between"the"number"of"fans"and"followers;"Users"with"high"influence"generally"exhibit"a"lower"frequency"of"forwarding"the"same"short"video,"yet"their"distribution"of"forwarding"targets"tends"to"be"more"diverse."The"frequency"of"interaction"with"fans"differs"based"on"the"needs"of"individual"verified"celebrity"users,"businesses,"media"organizations,"and"other"verified"entities."When"short"videos"form"a"trend"of"widespread"dissemination,"the"number"of"forwards"is"very"close"to"the"number"of"comments,"or"even"significantly"surpasses"it,"while"there"is"no"significant"correlation"between"the"number"of"replies"to"comments"and"personal"influence.
Key"Words:"Individual"influence;"Group"behavior;"Followers;"Fans;"Dissemination"behavior"characteristics
在短視頻站點中,個體的影響力是個體之間互動產生的相互作用,也是一種個體能夠影響其他個體,使之進行分享、轉發和評論等傳播行為的能力,是造成信息傳播的先決條件之一。具有高影響力的真實用戶個體,在短視頻站點中對信息的傳播有重要的推動作用,一般是信息傳播的源節點或骨干轉發節點。如果能準確地判斷用戶的影響力,就能預測信息的傳播的方向、路徑和范圍,為社會輿論的傳播預測、企業的精準營銷策略、主題的傳播范圍等應用提供真實有效的數據和結論支持。對群體數據深入挖掘和統計分析,是獲得個體興趣愛好與行為規律的主要方法。本文面向短視頻站點,對于關注與粉絲群體的數量、比例、轉發、評論等數據進行實證分析,研究群體的傳播行為和過程,總結出群體行為特征與個體影響力的關系,分析判斷個體影響力的幾個關鍵因素,提出了用戶影響力判斷方法,最后進行實驗分析。
1""相關研究
國內外對網絡個體影響力判斷方法以及對社交信息傳播的影響,進行了豐富而卓有成效的研究。王璿等人[1]提出,影響力最大化的研究,是在某種社交網絡傳播模型中,如何選取一組種子用戶,使信息通過這些用戶實現最大范圍的傳播。現有算法主要存在兩個問題:一是由于影響范圍有限,時間復雜度高,難以適用于大規模社交網絡;二是僅局限于特定傳播模型,只能解決單一類型社交網絡下的影響力最大化問題,當使用在不同類型社交網絡上時效果較差。劉小洋等人[2]提出了一種基于局部節點以及度折扣的社交網絡節點影響力推薦系統,包括網絡節點獲取模塊、計算篩選模塊和擴散推薦模塊,可以用于向節點進行產品推薦。劉鑫哲等人[3]提出了一個基于圖表示學習的框架,可以解決競爭場景下的群體影響力識別問題。張海粟等人[4]融合拓撲勢和因子圖,提出影響力因子圖模型,可以推斷網絡用戶節點間影響力,并對每個節點分配不同影響參數。葉佳鑫等人[5]提出了一種基于影響力傳播的社交網絡群推薦方法,綜合考慮個體興趣與其受核心群體影響而產生的興趣,從而進行社交網絡群推薦服務。Mikolov"T等人[6]提出一種學習網絡中節點隱藏表達式的算法,它通過隨機行走模型獲得網絡中的節點序列,然后使用Word2Vec的思想將節點轉換為低維向量并用于分類。楊杰等人[7]提出了一種融合覆蓋范圍和結構洞的影響力的最大化算法NCSH,解決了傳統算法只考慮單一的網絡中心性,沒有綜合考慮節點特性和網絡拓撲結構的問題。Thakoor"S等人[8]使用對比學習的思想從圖中隨機刪除邊緣,以進行數據增強。毋東等人[9]提出了一種基于時間約束的影響力最大化方法。Pandit."S等人[10]提出了在給定鄰居節點可以相互影響的網絡中,把一條信息可以分布到k個節點,可以通過找到k個節點來最大化信息傳播效果,并通過現有的傳輸模型來判斷信息傳輸量。Jingxuan"L"I等人[11]提出了一種有利于提高信息傳播量并且可擴展的多項式時間算法,其優點是它不明顯依賴于任何類型的調諧參數,還提出了一種用于預測社交網站用戶的基于連續時間馬爾可夫過程的動態信息傳輸模型。
2""群體行為特征數據分析
通過分析短視頻站點的用戶群體數據后,本文對群體的具體行為數據進行研究和分析。研究內容包括:對發送和轉發的短視頻,評論、粉絲和關注的分布特征等內容進行數據統計,總結特征分布的原因和群體的行為規律。
2.1.1"""群體行為分析
在短視頻站點中,關注是節點獲取其他節點信息的主要方法,當A節點關注節點B后,A增加了一個關注,而B增加了一個粉絲。因此,在節點數量不變的情況下,在整個短視頻站點中,關注與粉絲的總數量是相等的。
節點的關注和粉絲的數量取決于節點自身的行為活躍度。可把用戶根據活躍度和行為分為三類節點:傳播源點,經常更新和發送短視頻信息,較少關注或轉發他人信息;傳播節點,經常閱讀關注傳播源節點的信息,會轉發其信息;傳播終點,不管是否有閱讀短視頻,均不會轉發信息的節點。短視頻用戶群體的行為也可以分為兩種:在線瀏覽和發送短視頻(轉發、評論等)。
通過分析短視頻站點用戶關注數量和粉絲數量的分布發現,短視頻用戶的關注數量分布沒有明顯的規律。產生這種現象的原因是,短視頻用戶之間的關系是一種單向的興趣鏈接,也就是說用戶只要對其他用戶有社會交往或瀏覽短視頻等興趣,就可以單向鏈接對方,而無須經過對方同意,也無須雙方產生相互的興趣。這種拓撲結構導致大量用戶的關注數量小于粉絲數量,其關注數量分布在160~450范圍內,關注分布近似服從冪律分布。用戶的粉絲數量基本服從冪律分布,擁有大量粉絲的用戶數量少,大部分用戶的粉絲數量并不多;隨著粉絲數量增加,用戶數量呈下降趨勢。
對用戶行為特征研究后,發現用戶觀看短視頻的在線時間越長,關注數量發生變化的概率越大。一般情況下,關注數量隨在線時間呈上升趨勢,但用戶在線時間與粉絲數量的變化并沒有明顯的相關性。其次,如果用戶經常在線發短視頻,或者轉發其他短視頻;當節點關注的數量提高時,粉絲的數量也會發生相應的變化。因此,可以判斷短視頻的數量和質量與粉絲數量有強關聯性。正常情況下,短視頻數量大,內容質量高的用戶,粉絲數量大。
2.1.2""四類個體行為分析
名人、媒體等高影響力賬號的關注較少,而粉絲數量很大,這是短視頻站點作為輿情傳播媒體的重要特征,即高影響力節點引發信息傳播。由于明星和媒體的粉絲數量遠遠大于關注數量,引發信息大面積傳播的概率也大于一般的個人。這些用戶賬號的在線時間較長,發送、轉發和評論短視頻的數量多,一般粉絲數量遠遠大于關注數量。大部分用戶賬號在線時,主要以閱讀關注者的短視頻為主,活躍度低,較少發送和轉發短視頻,一般粉絲數量小于關注數量。目前,還有一種針對信息傳播或提高帳號等級等行為而創建的賬號,這類賬號通常活躍度極低,只轉發某些固定的廣告或信息,關注數量和粉絲數量的差距非常大,如表1所示。
關注和粉絲的比例是判斷一個用戶的影響力的關鍵因素,可以把短視頻的各種用戶總結為四類,分別是活躍用戶、普通用戶、僵尸用戶和虛假用戶。一般來說,活躍用戶包括獲得個人認證的明星或普通人帳號、獲得機構認證的媒體、企業帳號、短視頻達人帳號等,他們經常發送或轉發短視頻,是引發信息大面積傳播的傳播源點,擁有龐大的粉絲數量和很少的關注數量,因此關注與粉絲的數量比值非常小,影響力很大。普通用戶主要包括獲得個人認證的用戶賬號、普通的短視頻會員賬號等,以瀏覽短視頻或轉發短視頻為主,有較多的關注和較少的粉絲,其比值較大,是傳播節點或傳播終點,引發信息廣泛傳播的概率較小,影響力低。僵尸用戶是指一些活躍度低,在線時間很少的認證或非認證用戶賬號,關注和粉絲數量都很少,其比值與活躍用戶相似,很難引發信息傳播,影響力很小。虛假用戶以關注其他用戶和轉發各種廣告信息為主要目的,因此粉絲數量很少,關注數量較大,其比值也大,無法引發信息傳播,幾乎沒有影響力。
分析結果表明,影響力大和較小的用戶,粉絲數量和關注數量之間幾乎無相關性,影響力達到一定的數值時,粉絲數量和關注數量為強相關性。
2.1.3"""粉絲數量和質量
部分研究認為,粉絲數量大,影響力高,粉絲數量大的節點,容易在較短的時間達到信息傳播的最大范圍,個體的粉絲數量是判斷個體影響力的一個重要因素,用戶的粉絲越多,影響力越大。但是近年來,隨著短視頻營銷的流行,越來越多的企業機構或個人利用信息傳播銷售產品或發送廣告。網上出現了許多刷粉絲、購買粉絲的行為,導致短視頻的虛假用戶和被盜用的僵尸用戶數量急劇增加。因此,單純計算粉絲數量無法判斷個體真實的影響力,還需要判斷粉絲的類型和活躍度,只有符合影響力判斷標準的粉絲數量才能成為計算的有效數據。
用戶活躍度是反映用戶參與社交活動的積極程度的指標,也是一種判斷粉絲質量的方法。把用戶在短視頻站點中的活躍度定義為單位時間內用戶發表的原創短視頻數量、轉發短視頻數量或評論數量的和。有的用戶經常發送短視頻、與粉絲互動,有的用戶只瀏覽別人的短視頻,自己很少發送或評論。如果經常發送短視頻或者評論別人的短視頻,證明用戶具備較強的信息傳播能力,在網絡的活躍度高。
2.1.4""轉發對象分布與轉發頻率
轉發行為是最直接的信息傳播行為,用戶閱讀了感興趣的短視頻后,發送到自己的短視頻頁面中,也可同時提醒給其他用戶查看。轉發的對象是用戶的關注者following的短視頻,正常來說,用戶會轉發哪些關注者是沒有規律的,其對象的分布是離散的。如果其對象分布相對集中,可能這部分關注者對用戶產生了較大的影響力。對于虛假用戶,通常呈現出轉發分布高度集中的特點。
一般情況下,用戶只會對感興趣的短視頻轉發一次,不會多次轉發同一條短視頻。用戶多次轉發相同的短視頻,極有可能是發送廣告等商業營銷行為。用戶轉發相同的短視頻頻率越高,其身份為虛假用戶或僵尸用戶的可能性越大。這類用戶雖然也會傳播信息,但大多是人為地傳播某種廣告,并不是用戶自發的信息傳播行為,會嚴重干擾預測正常的信息傳播和輿論方向。
2.1.5""信息傳播行為分析
當個體瀏覽關注者的短視頻時,如果對這條短視頻產生了興趣相似性或觀點一致性的意見時,用戶可以對該短視頻進行留言評論,或轉發到自己的短視頻主頁。當自己的粉絲看到這條短視頻時,也可能做出相同的行為,從而形成了短視頻傳播的過程,這種行為可以稱為信息傳播行為。當關注者看到粉絲的評論或留言,可以對評論進行回復,這就產生了社交互動。關注者和粉絲頻繁互動有利于強化彼此的友誼以及相互的影響力。
如圖1所示,在粉絲數量和活躍度較高,短視頻內容質量高的前提下,用戶發送短視頻的數量越大,可能被陌生粉絲轉發和評論的概率和數量越高。從理論上看,短視頻數量與被轉發的數量有成正比的規律。有趣的是,越是熟悉的人,產生轉發的概率和數量卻呈下降趨勢。這與易成岐等人[12]的傳播研究得出的結論一致,越是關系好和熟悉的人,越容易形成觀點的封閉空間,轉發對方的視頻的概率和數量都很低。
如圖2所示,明星賬號擁有海量的粉絲,短視頻更新速度快、數量大,每條短視頻的都會產生大量的評論和轉發,但明星很少會回復一般粉絲的留言和評論。因此,互動中的評論和回復,并沒有明顯的正比關系。相反,用戶與自己熟悉了解的朋友或認識的人,產生互動的頻率和概率遠遠高于陌生的粉絲,朋友之間的評論與回復數量幾乎完全成正比。
3"個體影響力判斷方法設計
通過對群體行為數據分析和研究,決定判斷個體影響力的若干關鍵因素,設個體影響力判斷方法如式(1)所示:
其中,設發送(含轉發)和評論短視頻的行為表示forwording,關注表示following,粉絲表示follower,N表示行為或節點的數量。因此fforwording表示轉發(評論)相同短視頻的頻率,Nforwording表示發送(評論)短視頻的數量,dforwording表示最近200次轉發(評論)短視頻的分布率,Nfollowing和Nfollower表示關注的數量和粉絲的數量,兩者的商為關注節點與粉絲節點的比例。Ix表示x用戶個體的影響力,?y"follows"x"."Iay→x表示x的粉絲y對x的影響力貢獻;(1-fforwording).Nforwording表示發送內容不同的短視頻數量。對于個體x的粉絲y對x的影響力貢獻表示?y"follows"x"."Iay→x。部分研究者認為y的影響力是平均分配給每一個關注者的。但實際上,粉絲關注了許多朋友,并不是對所有朋友的關注程度都一致。短視頻站點為用戶提供了特別關注功能。該功能可以把用戶希望經常關注的朋友進行分組,并提供快速閱讀特別關注者的短視頻等功能。設對每一個關注者的影響力貢獻為一個數列,數列中的每一個數是對每一個關注者的影響力貢獻項,如:{yn}="y1,"y2,"y3,"...,yn,...,n為關注者的數量。把該影響力貢獻數列yn=f(n),當n趨向于無窮大時,對應的yn=f(n)會無限接近于某個確定的數值。根據對短視頻站點用戶影響力的研究和極限的定義,數列f(n)與常數k有下列關系:設k為個體的影響力值當對于任意小的給定的正數q,總存在正整數N,使得ngt;N時一切均成立,則可以證明影響力貢獻數列收斂于k。因此,公式可以化為如式(2)所示:
4"實驗分析
根據前面章節獲取的短視頻數據和總結的群體行為特點,對個體影響力判斷計算,進行活躍用戶屬性與轉發特點數據統計實驗與分析。表2是統計了個體的基本屬性和短視頻轉發的特點,對用戶的影響力進行計算后獲得的用戶影響力排名。統計的個體均為活躍用戶,基本屬性包括短視頻、粉絲和關注的數量;轉發特點包括轉發或評論其他用戶的分布律,以及轉發或評論相同短視頻的頻率。如表2所示,數據說明,高影響力的個體轉發相同短視頻頻率的一般都比較低,其轉發對象的分布律一般較高。這與高影響力的演員、歌手、CEO和傳媒這些用戶,都是信息的傳播源點有關,他們較少關注其他用戶,轉發同一條短視頻的可能性非常低;而轉發他人短視頻的行為只集中在少數熟人或朋友用戶上,因此集中分布律較高。從用戶的基本屬性看,活躍用戶的影響力與短視頻和粉絲的數量有直接的關系,而關注數量通常較小,說明個體影響力與關注數量并無關聯。
5""結論
根據短視頻用戶群體傳播數據分析的結果,本文提出一種個體影響力判斷及計算方法。該方法以粉絲和關注的數量、轉發和評論的數量,轉發分布律和粉絲對節點的影響力貢獻為條件,通過影響力貢獻數列計算粉絲對不同的關注者不同的影響力貢獻。統計結果解釋了社交網絡的群體傳播現象,總結了個體影響力與活躍用戶自身屬性、轉發特點和粉絲行為的關系。本方法可以為社會輿論的傳播預測、企業的精準營銷策略、主題的傳播范圍等應用提供有效的個體影響力量化方法。但是,研究是從活躍個體的傳播行為角度進行分析的,只能說明傳播源節點自身影響力的部分規律,下一步還需要從傳播群體的興趣相似性和消息主題的重疊性方面做深入分析才能發現更多潛在的規律。
參考文獻