劉小洋,唐 婷,何道兵
(重慶理工大學 計算機科學與工程學院,重慶 400054)
隨著新媒體的迅猛發展,其正在逐漸替代電視、廣播、報紙等傳統媒體,成為人們獲取信息的主要途徑。在線社交網絡(微博、微信、Twitter、Facebook等)中,信息以類似病毒的不斷復制、擴散的方式傳播,從而實現了“一傳十,十傳百”的傳播效果。互聯網以其開放性、匿名性及互動性為特色,為網民提供了抒發自我情感、獲取熱點事件的途徑。輿情是指作為主體的社交網絡參與者在一定階段和地理范圍內,對社會事件或社會現象發表的帶有個人傾向的意見或言論[1]。圖1為在線社交網絡輿情形成過程。
從圖1中可看出,隨著信息時代的到來,新的傳播技術帶來了新的傳播方式,網民借助微博、微信、短視頻、直播等新的傳播方式主動發布意見,參與意見傳播和輿論形成,使得社交網絡成為收集民意的有效途徑之一,對推動社會進步起到了積極作用。同時,一些惡性事件被別有用心的組織和人員經過互聯網的“放大”作用后,則會給國家安全、社會穩定帶來重大影響[2]。因而,對待輿情,要進行有效管理及引導,能夠在短時間內利用“黃金4小時媒體”[3],即微博、微信、QQ群、貼吧等新媒體傳播平臺,控制事件的傳播、發酵,從而,不被輿情牽著鼻子走,使得政府的主流意見成為輿論主導,始終保有主動權[4]。“沒有網絡安全就沒有國家安全”,這也是各級政府部門之所以高度重視網絡輿情工作的重要原因。

圖1 在線社交網絡輿情形成
在此背景下,建立一個完善的輿情理論認知體系也就成為了大數據時代的重要課題之一。
國內外學者就網絡輿情信息傳播及其應用已經開展了大量研究工作,如輿情的監測與分析、輿情發展規律與研究、輿情的管理及引導等。在這些研究中,文獻[5]提出一種基于詞典的情感分析算法來提取和衡量用戶的意見,引入詞義消歧算法和否定技術來提高輿情發現準確性。文獻[6]對Web評論的傾向和強度進行向量形式的定量,建立了基于定量評論和情感熱門輿論發現模型。文獻[7]以疫苗接種問題為例,運用不同文本表示及分類方法,提出一種民意監測系統。文獻[8]引入T算子時延微分方程,研究了自媒體的網絡新聞傳播趨勢。文獻[9]對感染閾值及難處理閾值這兩種情感傳播閾值進行了研究,并提出了一種基于貝葉斯更新規則的交互模型,用于遏制謠言的傳播。文獻[10]將輿情在社交網絡中的傳播映射為森林火災的傳播,通過突出特征檢測輿情傳播路徑,識別在輿情傳播過程中起主要作用的節點。
以上學者從不同角度出發對輿情信息在社交網絡上的傳播進行了研究,但缺少針對社交網絡用戶自身屬性及信息熱度的研究。因此,針對該問題,本文在傳統信息傳播模型基礎上,抽取參與主體的特征,即信息的熱度,用戶的影響力、態度和年齡等用戶屬性,明確主體間的交互行為及規則,提出一種基于社交網絡用戶自身屬性的信息傳播模型,模擬了輿情演化過程,與實證進行對比,驗證了仿真結果的正確性。
文獻[11]在研究大型社交網絡中的影響力最大化問題時提及了信息傳播基本模型,包括獨立級聯模型(IC model)及線性閾值模型(LT model)。
獨立級聯模型是一種概率模型,以發送者為中心,在此模型中信息傳播過程是在圖G=(V,E)上進行的。其中,V代表網絡中的用戶,E代表用戶間的關系,G=(V,E)的每一條邊對應傳播概率P[v,w],其中,v和w分別為圖G=(V,E)中的兩個相鄰節點。在信息傳播中,節點分為兩種狀態: 活躍和非活躍,其中,活躍點表示已接收信息,非活躍點表示還未接收信息,并且節點只能從非活躍點轉換為活躍點,該轉換不能逆轉。當在時刻t節點v被激活,則獲得一次以成功率為P[v,w]向鄰居節點w產生影響的機會,若激活成功,則在t+1時刻,節點w轉為活躍狀態。圖2為獨立級聯模型的傳播過程。

圖2 獨立級聯模型的4步傳播過程

傳統的獨立級聯模型和線性閾值模型都是將信息傳播看成是節點狀態的變化。然而,在實際社交網絡中,信息的傳播是以異步方式進行,時間標記并非等距,每個節點接受信息的延遲也不一定相同。因此文獻[12-14]都對這兩種模型按照異步時間進行模擬擴展,提出了一些非同步模型,其中較為典型的擴展模型為AsIC(Asynchronous IC model)模型和AsLT(Asynchronous LT model)模型。圖3為IC模型和AsIC模型的傳播對比圖。

圖3 IC模型和AsIC模型
“生命周期”最初是指生物體的形態或者功能在生命演化過程中所經歷的一系列階段或改變。
生命周期理論[15]在網絡輿情演化中的應用可以包括兩層含義。一是表明輿情事件在網絡平臺中的傳播具有明確的生命周期特征。即網絡輿情在其演化過程中會經歷從產生、發展、衰退到死亡的生命過程;二是依據網絡輿情事件在不同生命階段的特征差異,將網絡輿情事件的演化過程區分為明確的若干階段[16-17],為網絡輿情事件研究提供更為準確的分析思路。
我國學者通過案例分析,對網絡輿情的生命周期進行了劃分,如表1[18]所示。

表1 網絡輿情生命周期的劃分

續表
觀察表中輿情演化階段的劃分可得出,網絡輿情的演化可概括為五個階段。第一個階段為潛伏期,即事件信息已存在,但能量不夠,沒有大范圍傳播;第二個階段為爆發期,由于較多的用戶開始出現,能量開始快速聚集,關注度大幅增加,形成網絡輿情;第三個階段為成熟期,輿情已形成,關注人數相對穩定;第四個階段為衰退期,隨著輿情事件處理結果的出現,及社交網絡用戶的新鮮感的下降,關注人數開始減少,輿情熱度開始冷卻;第五個階段為消退期,關注人數極少,能量趨于零。如圖4所示。

圖4 網絡輿情事件生命周期
在現實世界中,人與人之間的關系網絡是一種復雜的網絡[19],個體行為具有非線性、臨界值、規則和非線性耦合等特征,很難用微分方程來描述個體行為的非連續型特征,并且個體之間的交互是異構的,并可能產生網絡效應,所以平均、統計的方法不起作用。因此,本文采用多主體仿真方法,將社交網絡的組成分為三類實體,分別為發布者S(Sender),社交網絡用戶U(User)和信息M(Message),通過定義信息發布者發布信息、用戶之間的信息傳播等行為設定交互規則,針對社交網絡中網絡輿情的演化進行仿真研究。
在此模型中,用有向圖來表示整個社交網絡,以圖中節點來表示好友圈中的個體,以其連線來表示好友之間的交流方式和渠道。節點存在活躍與非活躍兩種狀態。當節點為活躍狀態時,說明節點接收到信息,當節點為非活躍狀態時,說明節點未接收到消息。
輿情演化環境僅限于社交網絡,且僅對單一事件進行輿情演化,在此環境中的社交網絡用戶均勻分布,不考慮同時存在的其他事件的影響。
2.2.1 用戶特征
輿情信息在社交網絡傳播過程中,用戶對于輿情信息的態度、用戶自身的年齡和影響力都會影響其傳播。為能合理地描述用戶影響力、態度及其年齡在信息傳播中所起的作用,對其用戶特征定義如下:
① 用戶影響力Infi(t)。影響力是描述“受眾的思想、觀念”的改變程度。根據傳播學的基礎理論可知,一個用戶的影響力較大時,此用戶對于輿情的態度往往能影響普通社交網絡用戶對網絡輿情的態度。
② 用戶態度Ai(t)。Ai(t)描述了當前用戶i在t時刻對信息持有的態度。在現實社會中,當輿情出現時,網絡用戶對于輿情的態度并不明確,易受到媒體或人際影響。因此本文將用戶態度分為支持、反對、中立三種。ai為用戶態度值的影響因子,當ai的值在[0,0.33]時,用戶的態度為反對Ai(t)=-1;當ai的值在[0.33,0.66]時,用戶的態度為中立Ai(t)=0;當ai的值在[0.67,1]時,用戶的態度為贊同Ai(t)=1。如式(1)所示:
(1)
③ 用戶年齡Yi。根據CMS媒介研究的12個城市的基礎研究數據發現: 不同年齡段的用戶因社會地位、心理、性格及學歷等因素,對信息的接受能力也不同。如“新聞”的受歡迎程度隨著被采訪者年齡的增加而提升;“音樂”則更受年輕人的喜愛等。具體數據如表2所示。
表2 不同年齡用戶在網絡板塊中的分布

據此本文為了不失一般性,加入年齡因子y,即此條傳播的消息在年齡為y的人群中更為容易傳播,并使用Yi表示用戶i對于信息的接受能力。計算如式(2)所示。
(2)
④ 用戶傳播意愿Fi(t)。信息在傳播過程中,由于每個節點對同一信息的傳播意愿都大不相同,且用戶傳播意愿受到其自身屬性的影響,從而得到式(3)。
Fti=Infi(t)+Ai(t)+Yi
(3)
同時,隨著節點對同一信息的新鮮度會有所下降,傳播意愿會隨著時間推移而降低,最終發布的信息將會慢慢失去熱度而無人關注。
為方便對用戶傳播意愿進行描述,對其進行歸一化處理,如式(4)所示。
(4)
2.2.2 信息特征
① 初始能量E0。當信息發布時,網絡中的某幾個初始節點帶有一定的能量,能量的大小由信息的熱度及其影響力決定。
② 傳播概率λ。當前非活躍節點轉化為活躍節點的可能性大小。即當用戶傳播意愿β時,非活躍節點轉化為活躍節點,信息得以傳播。且β的大小由信息熱度決定。
對于以上幾個特征,由于其代表的物理意義不同,各個值取值范圍不一,因而采用Min-Max標準化方法,將不同特征值取值范圍映射到[0 1]區間。
現實社交網絡中,信息的產生來源于發布者S,他們通過編輯消息M進行信息推廣;而社交網絡用戶U則是網絡環境中最普遍的參與者,由于其數量龐大,因而是輿情傳播的主要力量。在信息傳播過程中,社交網絡用戶U瀏覽到信息時,受到自己自身屬性的影響來對信息進行判定,即是否對此信息有較大傳播意愿,最后再對外傳播。輿情演化流程圖如圖5所示。

圖5 輿情演化流程圖
網絡輿情演化步驟如下:
步驟1事件發布者S在社交網絡中隨機移動,以一定的概率發布信息M,再根據所發布信息M的影響力、熱度來設定信息M的初始能量。在社交網絡傳播過程中,信息M的能量隨時間減少,當信息M的能量小于0時,代表信息M無人關注,輿情消散。
步驟2社交網絡中的用戶U開始隨機移動,即代表用戶U的瀏覽行為。當遇到信息M時,根據此用戶U的影響力、態度、年齡的不同以不同的概率傳播信息,信息M能量增加。
步驟3重復步驟1-2。
為驗證社交網絡用戶自身屬性的信息傳播與輿情演化模型的有效性,開展仿真實驗,實驗參數如表3所示。

表3 仿真實驗參數
① 第一組實驗。設定N取值為800個,S分別取值為5和2,y取值為30,E0取值為59,λ取值為0.1,inf取值為0.01。進行多次仿真,具有代表性的輿情演化過程如圖6所示。

圖6 信息發布者人數
對第一組實驗結果進行分析: 首先,通過觀察圖6中S=5的“影響人數”曲線變化趨勢,發現其符合圖4中關于網絡輿情事件生命周期的劃分,證明了仿真程序基本正確,模型有效;其次,影響人數比例會隨著發布者個數的增加而增大,且信息的持續時間增長,因而當S=5時,輿情形成;當S=2時,未能形成輿情事件,這說明發布者個數會影響輿論的形成。
根據此特點,輿情事件爆發后,管理部門可以通過輿情監測等手段,在輿情潛伏期時盡早挖掘并處理造謠者,降低社交網絡用戶接觸謠言的機會,從而在根源處限制謠言的出現。
② 第二組實驗。為研究信息初始能量對輿情傳播的影響,設定N取值為800個,S分別取值為5,y取值為30,E0取值為30和59,λ取值為0.1,inf取值為0.01。輿情演化效果如圖7所示。

圖7 信息初始能量
由圖7可見,隨著能量E0的增加,信息傳播的影響人數比例相對有所增加,信息傳播的持續時間增長,而且峰值所占社交網絡用戶比例也逐漸增大。所以社交網絡中的輿情管理應以熱門信息為重點管理對象,集中資源進行檢測和管理。
③ 第三組實驗。設定N取值為800個,S分別取值為5,y取值為30和50,E0取值為59,λ取值為0.1,inf取值為0.01。輿情演化效果如圖8所示。

圖8 用戶年齡
從圖8中可以看出,雖然信息的初始能量及傳播概率等參數取值均相同,但是由于年齡的參數取值不同,導致信息的傳播過程并不完全一致。據此,在選擇傳播對象時,要注意用戶定位,例如在選擇一些綜藝類節目的推廣用戶時,定位于更樂于接受新鮮事物的80、90后,進而使得信息更容易傳播。
④ 第四組實驗。研究用戶影響力對于網絡輿情傳播的影響。在這組實驗中,設定N取值為800個,S分別取值為5,y取值為30,E0取值為59,λ取值為0.1,inf分別取值為0.01與0.02。圖9為inf取不同值時輿情演化過程。

圖9 用戶影響力
從圖9中可以看出,隨著影響力較大的用戶所占總人數的比例的增加,影響人數比例峰值到達時間減少,影響人數相對增多。所以政府部門應該培養影響力較大、具有正確價值觀念的社交網絡用戶,在網絡輿情產生后,通過這些用戶及主流媒體來對事件真相進行宣傳,引導普通用戶的情感傾向,從而掌控輿情走向,讓謠言不攻自破。
為驗證此模型的有效性及其可靠性,本文從百度指數——大數據分享平臺中隨機抽取四條2018年熱點事件信息進行實證對比。熱點數據如圖10所示。這四條數據來自不同的領域,有一定的代表性。

圖10 熱點事件數據
3.2.1 實證驗證設計
在這四條熱點信息中,社會事件“港珠澳大橋通車”,無論是在促進地區經濟發展上,還是在對香港、澳門和珠海這三地人員的往來上影響都非常大。該事件與社交網絡用戶的利益緊密相連,因而網民對其關注度較高,初始能量較大,并且此類社會新聞的關注人群較多集中于30至50歲。另外三條熱點信息通過類似方法分析選取相關參數。仿真具體參數設置如表4所示。

表4 仿真數據
3.2.2 實證結果分析
通過抓取在線社交網絡的真實數據并通過實證實驗,得到結果如圖11所示。
通過觀察圖11及表5可以得出: 該模型的輿情演化趨勢與真實數據相符,能夠較好地模擬社交網絡中輿情信息的傳播。為了更好地說明提出模型的優越性,特將本文提出的模型與傳統的IC模型在相似度上進行對比分析,如圖12所示。

表5 實證仿真數據表

圖11 實證仿真對比圖

圖12 實證仿真相似度對比圖
由圖12可知,本文所提出的模型優于傳統的IC模型。分析其原因是,傳統IC模型只關注了數據傳播路徑本身,而沒有考慮節點屬性、信息屬性等因素對信息傳播的影響。通過3.2節的分析及圖11的實證仿真對比可知,研究在線網絡用戶的屬性對于社交網絡信息的傳播是積極的、有意義的。
本文通過抽取用戶屬性特征,結合AsIC模型,建立了基于社交用戶自身屬性的信息傳播模型。從仿真模型及實驗結果來看,可以證明在沒有外界因素的干擾下,該模型能較好地適應信息傳播規律,能夠合理地描述用戶影響力、態度及年齡在信息傳播中所起的作用,使得該模型更加符合現實世界中的信息傳播。該模型的輿情演化趨勢與真實數據較為一致,能夠在一定程度上反映信息在線社交網絡中傳播的特點。但此模型也存在一些需要改進的地方,例如現實中的社交網絡應該是無尺度網絡,而不是本文模擬的純隨機網絡等。下一步工作將在此基礎上對人際復雜網絡模型進行進一步的研究,從而提高模型的可靠性及有效性。