鐘磊
(新疆財(cái)經(jīng)大學(xué) 信息管理學(xué)院,新疆 烏魯木齊 830012)
根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心第49次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告顯示,截至2021年12月,中國網(wǎng)民數(shù)量達(dá)到10.32億,互聯(lián)網(wǎng)普及率達(dá)到73%,網(wǎng)民使用手機(jī)上網(wǎng)的人數(shù)比率為99.7%。網(wǎng)絡(luò)已經(jīng)成為人們表達(dá)個(gè)人想法、交流和共享信息的不可或缺的手段。用戶幾乎每天二十四小時(shí)不間斷在網(wǎng)絡(luò)社區(qū)中發(fā)布海量信息。網(wǎng)絡(luò)社區(qū)中信息傳遞的雙方互動(dòng)性和對(duì)稱性很強(qiáng),信息可以進(jìn)行實(shí)時(shí)的反饋。網(wǎng)絡(luò)論壇就是一種網(wǎng)絡(luò)社區(qū)的典型代表,是很多網(wǎng)民集中參與討論、傳遞信息、發(fā)布意見的虛擬空間。一般都按話題進(jìn)行分類,信息具有很強(qiáng)的針對(duì)性,社區(qū)成員間通過“發(fā)帖—回帖—跟帖”的行為序列進(jìn)行互動(dòng)或者通過收藏、點(diǎn)贊、關(guān)注等行為進(jìn)行雙向或單向的互動(dòng)。某些小的話題經(jīng)過網(wǎng)絡(luò)空間的放大之后,可能會(huì)形成洶涌的網(wǎng)絡(luò)輿情浪潮。因此,有必要研究網(wǎng)絡(luò)社區(qū)一般信息傳播特點(diǎn),尋求其中的普遍規(guī)律,提出相應(yīng)的信息管理方法。為進(jìn)一步識(shí)別網(wǎng)絡(luò)熱點(diǎn)信息,監(jiān)控和引導(dǎo)網(wǎng)絡(luò)輿情等工作奠定基礎(chǔ)。
周楊、張會(huì)平依據(jù)微博數(shù)、關(guān)注數(shù)和粉絲數(shù)等信息,把用戶劃分為游離型、信息獲取型、活躍型和名人型4種用戶類型,構(gòu)建了微博用戶偏好模型,并進(jìn)行了相關(guān)實(shí)證研究,最后提出了輿情用戶分類識(shí)別和引導(dǎo)的相關(guān)建議。曾潤喜、徐曉林采用內(nèi)容分析法對(duì)新浪網(wǎng)某新聞樣本的跟帖進(jìn)行了多維度分析,從網(wǎng)絡(luò)輿情的時(shí)間分布情況、網(wǎng)民的使用媒介、網(wǎng)民的態(tài)度和指向類型等行為屬性進(jìn)行了相關(guān)實(shí)證研究,相關(guān)結(jié)論開辟了網(wǎng)絡(luò)輿情傳播規(guī)律研究的新視角。張思源等人通過循環(huán)迭代不斷移除社會(huì)網(wǎng)絡(luò)中相異性最高的邊,從而獲得新的社區(qū)結(jié)構(gòu),從社區(qū)發(fā)現(xiàn)的視角進(jìn)行了網(wǎng)絡(luò)社區(qū)用戶群體分類。識(shí)別具有影響力的用戶,即網(wǎng)絡(luò)意見領(lǐng)袖,也受到廣大學(xué)者的關(guān)注。識(shí)別具有影響力的“博主”,識(shí)別學(xué)術(shù)社區(qū)中具有影響力的學(xué)者等,從已有的研究可以看出,意見領(lǐng)袖和非意見領(lǐng)袖對(duì)網(wǎng)絡(luò)社區(qū)發(fā)帖行為有重要的影響。此外,很多研究認(rèn)為,網(wǎng)絡(luò)社區(qū)中的帖子的質(zhì)量和類型對(duì)平臺(tái)的活躍度也具有重要的影響。如果一個(gè)網(wǎng)絡(luò)平臺(tái)充斥著重復(fù)的、無用的或者低質(zhì)量的信息,那么該平臺(tái)可能會(huì)很快走向消亡。在已有的大部分研究當(dāng)中,很多學(xué)者采用傳播學(xué)、信息學(xué)和管理學(xué)等理論進(jìn)行定性的研究。在定量的研究當(dāng)中,基本采用分類、聚類和社會(huì)網(wǎng)絡(luò)分析等方法進(jìn)行,鮮有選用計(jì)量模型進(jìn)行相關(guān)研究的前例,因此,本文使用Tobit模型進(jìn)行數(shù)據(jù)分析,希望從中得到不同的啟示。
Tobit模型由經(jīng)濟(jì)學(xué)家、諾貝爾獎(jiǎng)獲得者托賓在1985年提出。Tobit模型可以很好地解決觀測(cè)數(shù)據(jù)或者因變量取值受限或被截?cái)嗟囊活惢貧w問題。如果樣本中有一些數(shù)據(jù)無法被觀察到,而是以一個(gè)特定的值代替,則稱為受限回歸;如果范圍內(nèi)的部分觀測(cè)值被舍棄,則稱為截?cái)嗍交貧w。
選擇某網(wǎng)絡(luò)社區(qū)用戶回帖數(shù)量作為因變量。影響網(wǎng)絡(luò)社區(qū)用戶回帖數(shù)量的因素主要有:發(fā)帖的類型、質(zhì)量,精英型用戶即意見領(lǐng)袖的參與程度,發(fā)帖內(nèi)容的認(rèn)可程度等。因此,本研究在解釋變量的構(gòu)建上,選取了四個(gè)主要變量。第一個(gè)解釋變量為帖子的類型,分為原創(chuàng)帖和轉(zhuǎn)載帖。第二個(gè)解釋變量為主帖字?jǐn)?shù),代表帖子的長度。第三個(gè)解釋變量為意見領(lǐng)袖參與的程度,用意見領(lǐng)袖的人數(shù)來代表,這里定義粉絲數(shù)為50 000以上的用戶為意見領(lǐng)袖。第四個(gè)解釋變量為主帖的被認(rèn)可程度,以帖子的點(diǎn)贊數(shù)來度量。具體的變量設(shè)置如表1所示。使用這些數(shù)據(jù)建立Tobit模型。

表1 變量設(shè)置說明
在網(wǎng)絡(luò)論壇中,回帖的數(shù)量不可能取負(fù)值,回帖數(shù)最小為零,回帖數(shù)量的觀測(cè)值總是被截取為大于等于零的形式,建立Tobit模型如下:



其中和分別表示正態(tài)分布的概率密度函數(shù)和概率分布函數(shù)。將(y) 對(duì)第個(gè)解釋變量求偏導(dǎo)數(shù),可得第個(gè)變量的邊際效用:

文章使用爬蟲工具,從某知名技術(shù)類論壇中獲取了186個(gè)帖子,主題帖的數(shù)量為36個(gè),每個(gè)主題帖所對(duì)應(yīng)的回復(fù)帖子數(shù)量的均值為4.16,回復(fù)帖數(shù)量最大值為11,最小值為0。用Python簡單計(jì)算了每個(gè)主題帖的字?jǐn)?shù),人工統(tǒng)計(jì)出每個(gè)主題帖的類型、點(diǎn)贊數(shù)以及其下參與討論的意見領(lǐng)袖的人數(shù)。將統(tǒng)計(jì)得到的數(shù)據(jù)代入Tobit模型進(jìn)行分析,具體結(jié)果如表2所示。
從Tobit模型結(jié)果看出,Lx未通過顯著水平5%的卡方檢驗(yàn),這說明帖子的類型對(duì)其回復(fù)數(shù)的影響并不顯著,論壇用戶不會(huì)根據(jù)帖子是原創(chuàng)帖還是轉(zhuǎn)載帖來決定回復(fù)或者不回復(fù)。因此不同類型的帖子對(duì)論壇用戶的注意力吸引沒有太多差別。

表2 Tobit模型分析結(jié)果
Zs也未通過顯著性檢驗(yàn),因此認(rèn)為,對(duì)于一個(gè)帖子而言,是否能吸引其他論壇用戶的注意力,其長度并不太重要。一個(gè)主題帖如果想吸引網(wǎng)民的注意力,僅僅靠發(fā)長帖是不夠的,關(guān)鍵在于帖子實(shí)際包含的信息點(diǎn)是否足夠吸引人。某些時(shí)候僅僅是一個(gè)標(biāo)題,比如“五分鐘看懂譜聚類的原理”,一個(gè)標(biāo)題就能吸引很多用戶的關(guān)注。再比如某些帖子雖然字?jǐn)?shù)不多,或者僅僅是一張圖片,但是抓住了“痛點(diǎn)”,引起了其他用戶“共情”,就能迅速得到很多回帖。
Yjlx通過了顯著性檢驗(yàn)。這說明對(duì)于一個(gè)主題帖而言,意見領(lǐng)袖的參與非常重要。由表2可知,帖子討論過程中每增加一個(gè)意見領(lǐng)袖,回帖數(shù)將平均增加2.6個(gè),因?yàn)橐庖婎I(lǐng)袖的人氣和威信總能吸引大量的論壇用戶參與討論和回帖,因此要加強(qiáng)網(wǎng)絡(luò)信息的傳播,最好邀請(qǐng)盡可能多的意見領(lǐng)袖參與討論。
Dzs也通過了顯著性檢驗(yàn),說明主題帖的點(diǎn)贊數(shù)會(huì)對(duì)其回復(fù)數(shù)產(chǎn)生顯著影響。點(diǎn)贊數(shù)可以理解為論壇用戶對(duì)帖子的評(píng)分,自然評(píng)分越高的帖子越受關(guān)注。從表2可知,點(diǎn)贊數(shù)每增加1,回帖數(shù)平均增加1.28個(gè)。
隨后,從論壇中隨機(jī)抽取了10個(gè)主題帖,將數(shù)據(jù)代入模型,進(jìn)行了預(yù)測(cè),并將預(yù)測(cè)的回帖數(shù)量與論壇中的實(shí)際值進(jìn)行了比較。結(jié)果如圖1所示。模型具有一定的參考價(jià)值(紅色曲線為實(shí)際值,藍(lán)色為預(yù)測(cè)值)。

圖1 預(yù)測(cè)值與真實(shí)值對(duì)比
首先,正如前面分析的,雖然帖子的類型和帖子的長度對(duì)于信息的傳播沒有實(shí)質(zhì)性的影響,但是帖子實(shí)際包含的信息點(diǎn)卻對(duì)網(wǎng)絡(luò)信息影響很大。帖子往往可以通過標(biāo)題“博人眼球”或者通過某些信息點(diǎn)吸引用戶“共情”。針對(duì)這一情況,要加強(qiáng)帖子的分類管理,雖然現(xiàn)在的網(wǎng)絡(luò)論壇等媒介都基本實(shí)現(xiàn)了帖子按主題的分類管理,但管理還不夠靈活,論壇管理者應(yīng)該根據(jù)實(shí)際情況的需要,有意識(shí)地引導(dǎo)網(wǎng)民的討論內(nèi)容。網(wǎng)站應(yīng)該建立更加靈活的板塊分類功能,甚至可以動(dòng)態(tài)、自動(dòng)化完成個(gè)性化的信息分類和版塊生成工作,讓板塊細(xì)分盡可能多的覆蓋網(wǎng)民的興趣點(diǎn)。同時(shí)利用技術(shù)手段自動(dòng)將帖子進(jìn)一步分為科普帖、求助帖、灌水帖等,增強(qiáng)帖子的針對(duì)性,更容易獲得網(wǎng)民的響應(yīng)。
其次,培養(yǎng)網(wǎng)民的自律意識(shí)和誠信精神。目前的技術(shù)手段可以實(shí)現(xiàn)對(duì)帖子內(nèi)容一定程度的過濾功能,但是遇到深層語義方面的過濾則力不從心。因此,僅靠技術(shù)手段是行不通的,除了依靠人工監(jiān)管,還要提高網(wǎng)民自身素質(zhì)。比如不用“別有用心”的標(biāo)題來“嘩眾取寵”,自行保證帖子“文題一致”等等。提高網(wǎng)民網(wǎng)絡(luò)素質(zhì),規(guī)范網(wǎng)民行為,增強(qiáng)網(wǎng)民規(guī)范上網(wǎng)意識(shí),才能使網(wǎng)民自覺抵制錯(cuò)誤取向,自覺維護(hù)網(wǎng)絡(luò)空間的道德和秩序。
最后,培養(yǎng)網(wǎng)絡(luò)“意見領(lǐng)袖”。從前面的實(shí)證可以看到,網(wǎng)絡(luò)意見領(lǐng)袖對(duì)信息的傳播具有重要作用,網(wǎng)絡(luò)意見領(lǐng)袖能促成網(wǎng)絡(luò)信息和輿論最終的形成。因此,意見領(lǐng)袖應(yīng)該在網(wǎng)絡(luò)信息傳播過程中,承擔(dān)起更多的社會(huì)責(zé)任與社會(huì)義務(wù)。在敏感的網(wǎng)絡(luò)信息傳播過程中,應(yīng)主動(dòng)正確發(fā)聲,減弱網(wǎng)絡(luò)上的“雜音”。發(fā)表對(duì)事件的客觀的、理智的觀點(diǎn),以此營造網(wǎng)絡(luò)正向氛圍,使輿情向正確的方向發(fā)展。尤其是現(xiàn)在的政治宣傳類網(wǎng)站,更應(yīng)該積極培養(yǎng)“紅色意見領(lǐng)袖”,讓他們定時(shí)定向地發(fā)聲來引導(dǎo)主流輿論,增強(qiáng)網(wǎng)絡(luò)正能量。
網(wǎng)絡(luò)言論開放,輿論分散,給網(wǎng)絡(luò)信息的控制和引導(dǎo)增加了難度。雖然網(wǎng)絡(luò)空間的自由與引導(dǎo)總是矛盾的,但是可以通過技術(shù)或者非技術(shù)的手段,在保證網(wǎng)絡(luò)空間自由度的同時(shí)進(jìn)行網(wǎng)絡(luò)信息的有效引導(dǎo)。