999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

內容生產及評論視角下的社交媒體關鍵用戶識別

2022-10-08 04:12:30周亦文
現代情報 2022年10期
關鍵詞:內容情感用戶

安 璐 周亦文

(1.武漢大學信息資源研究中心,湖北 武漢 430072;2.武漢大學信息管理學院,湖北 武漢 430072)

國家的安全和穩定是社會發展進步的保障。隨著國際形勢和國內形勢的變化,網絡安全問題成為國家和社會廣泛關注的問題?!吨腥A人民共和國網絡安全法》提出要“推動構建和平、安全、開放、合作的網絡空間,建立多邊、民主、透明的網絡治理體系”[1]。隨著技術發展,網絡社交媒體平臺成為民眾交流的主要渠道之一。借助社交媒體平臺,民眾能夠打破事件空間的阻隔進行交流。通過對社交媒體平臺上的用戶進行分析,可以及時對輿情進行引導,促進民眾參與維護國家安全[2]。

隨著互聯網技術的發展,社交媒體內容生產范式快速發展,內容生產呈現去中心化的趨勢[3-4],用戶生產內容成為信息內容生產的新形勢[5]。眾多網站、平臺積極促進普通用戶參與內容生產[6],用戶在進行內容生產的同時也能夠通過評論他人生產的內容實現與其他用戶的互動[7]。借助社交媒體平臺,用戶能夠通過信息內容生產及評論他人生產的信息內容表達真實的感受[8]。在社交媒體輿情分析中,社交媒體中生產的內容及對內容的評論是重要的數據來源[9]。用戶在扮演內容生產者時向信息受眾提供信息資源[10]。用戶針對信息內容進行評論時,可以視為用戶對信息內容進行轉譯[11]。因此針對信息內容的評論能夠體現用戶對信息內容的接受程度。

互聯網技術的發展打破了傳統媒體自上而下的信息傳播模式[12]。網絡社交媒體中用戶之間的互動成為常態,這也使得網絡社交媒體中的信息真假混雜,危害社會安全。因此,本文通過用戶畫像,從信息內容生產者及評論者視角對社交媒體平臺中的關鍵用戶進行識別。其中,關鍵用戶既包括能影響他人情感的用戶,也包括易被他人影響的用戶。通過與能影響他人情感的用戶合作,相關部門能更好地引導輿論。通過關注易受影響用戶的情緒狀態,可以及時防范或阻止過激行為。同時,本研究結果也能夠為內容服務平臺的運行模式和行業組織的發展規劃提供決策參考。

1 相關研究

1.1 用戶畫像

用戶畫像是從相關數據中提取整合有效信息[13]。用戶畫像的目的不同,構建的指標體系不同。因此,用戶畫像需要先確定所要描述的信息,再確定描述信息的方法[14]。王凌霄等[15]從用戶資歷、用戶參與度、用戶回答質量和用戶發展趨勢等方面進行用戶畫像以分析用戶群體。Ruas P H B等[16]基于聚類方法利用Facebook中的用戶交互記錄和復雜網絡指標對用戶進行劃分。Simsek A等[17]為了實現更好的廣告推薦,利用文本情感和關注關系進行用戶畫像。郭順利等[18]借鑒VALS2模型構建在線健康社區大學生用戶群體畫像的指標體系。Ouaftouh S等[19]基于改進的分區聚類算法整合用戶信息實現用戶畫像。

目前的研究中,用戶聚類的目的主要為用戶個性化推薦和用戶輿情引導。在針對用戶輿情引導的用戶畫像研究中,大部分研究沒有區分用戶在社交媒體中扮演的角色,忽視了用戶在扮演不同角色時的特征不同。本文將用戶在社交媒體中的角色分為內容生產者和內容評論者,基于此提出兩個指標體系對用戶進行畫像,并綜合分析。

1.2 關鍵用戶識別

網絡的發展,加速了民眾的信息交流。通過識別關鍵用戶,可以實現對網絡輿情的監測和引導,對網絡用戶的情緒狀態分析研判,維護一個良好的網絡社交環境。魏明珠等[20]基于用戶畫像分析社交媒體中的高影響力用戶特征。王闖等[21]利用K核分解基于用戶交互行為和文本特征識別關鍵用戶。李亞星等[22]分別基于用戶屬性和傳播能力對高影響力用戶進行排名,對二者的結果進行加權計算后得出具有高影響力的關鍵用戶。Cha M等[23]利用中心度和皮爾遜相關系數識別Twitter中的高影響力用戶。Jain L等[24]利用網絡結構特征和博弈論的原理進行識別關鍵用戶。Siddhartha J等[25]利用社會網絡分析方法識別關鍵用戶。Yamaguchi Y等[26]基于用戶—內容圖識別具有高影響力的關鍵用戶。Pal A等[27]利用高斯概率分布進行聚類分析識別主題高影響力用戶。

以往的研究中,關鍵用戶識別主要針對高影響力用戶。在輿情治理中,不僅應當關注高影響力用戶,也應當注意易被他人影響的用戶。因此,本研究提出情感共振值的計算方法、情感傳染能力指標和情感回饋值指標。根據這兩個指標可以度量用戶影響他人的能力和被他人影響的難易程度。

2 研究方法

2.1 研究路線

在社交媒體平臺中用戶可以劃分為內容生產者和內容評論者。內容生產者是發布原創內容的用戶;內容評論者是對信息內容進行評論的用戶,是內容服務的使用者。同一個用戶可以同時扮演內容生產者和內容評論者的角色?;诖耍瑯嫿▋热萆a者識別指標體系和內容評論者識別指標體系。隨后,計算各指標,基于兩步聚類方法分別進行內容生產者用戶畫像和內容評論者用戶畫像。在綜合內容生產者和內容評論者用戶畫像結果后,進行關鍵用戶識別。研究路線圖如圖1所示。

圖1 研究路線圖

2.2 關鍵用戶識別指標體系構建

互聯網空間中,個體通過碎片化的文本表達情感。網絡空間中過于情緒化的氛圍可能影響現實社會的安全[28]。因此,有必要基于用戶行為特征和用戶情感的相互影響特征等指標對用戶進行分析,以識別互聯網空間中情感傳遞行為中的關鍵用戶,用戶識別指標體系如表1所示。

表1 關鍵用戶識別指標體系

內容生產者識別指標體系的一級指標包括回答行為特征和影響力?;卮鹦袨樘卣靼ɑ卮痖L度、更新回答特征、廣泛度、積極情感強度、消極情感強度和綜合情感強度6個維度?;卮鸬拈L度和用戶的活躍程度是分析內容生產者的常用指標[29]?;卮痖L度通過度量回答的長度反映用戶在撰寫回答時的用心程度。更新回答特征通過度量內容生產者的持續更新時間反映內容生產者在回答發布后的針對該回答的活躍程度。在進行用戶行為分析時,用戶興趣也是常用的指標[30]。廣泛度可以度量用戶內容生產者的興趣的多樣性。在衡量內容生產者的情感表達特征時,情感的極性和情感的強度是常用的指標[31]。情感強度用于度量內容生產者的情感激烈程度。其中積極情感強度僅度量內容生產者表達積極情感時的情感激烈程度。消極情感強度僅度量內容生產者表達消極情感時的情感激烈程度。綜合情感強度同時考慮積極情感和消極情感,能夠反映內容生產者的平均情感強度及情感傾向。

在度量用戶影響力時,需要考慮用戶間的交互水平[32]。本研究選擇用戶間的評論關系度量用戶的交互活動的水平。此外,情感變化是度量網絡中用戶情感交互的重要指標[31],能夠反映用戶的影響他人情緒的能力。因此,影響力的二級指標包括影響范圍和正向情感傳染能力、負向情感傳染能力和綜合情感傳染能力。影響范圍能夠反映時間加權的用戶評論關系。情感傳染能力能夠反映交互活動中的情感變化。正向情感傳染能力是內容生產者促使他人對事件的情感與自己情感一致的能力。負向情感傳染能力是內容生產者使他人對事件的情感與自己情感相反的能力。綜合情感傳染能力同時考慮內容生產者的正向情感傳染能力和負向情感傳染能力,能夠體現內容生產者對群體情感的整體影響。

內容評論者識別指標體系從評論行為特征和易受影響程度兩個方面對內容評論者進行劃分。與內容生產者行為特征類似,內容評論者識別體系中的評論行為特征指標可細分為評論長度、關注度、廣泛度、積極情感強度、消極情感強度和綜合情感強度6個維度。評論長度通過度量評論的長度反映用戶撰寫該評論的用心程度。專注度可反映用戶在特定回答中的活躍程度。廣泛度可反映內容評論者興趣偏好的廣泛程度。用戶情感的相互影響特征在內容生產者識別指標體系中體現為影響力指標,在內容評論者識別指標體系中體現為易受影響程度。內容評論者識別指標體系的易受影響程度指標可細分為正向情感回饋、負向情感回饋和綜合情感回饋3個二級指標。正向情感回饋能夠反映內容評論者與內容生產者對事件的情感趨同時的情感激烈程度。負向情感回饋能夠反映內容評論者與內容生產者對事件的情感相反時的情感激烈程度。綜合情感回饋同時考慮正向情感回饋和負向情感回饋,可以反映內容評論者是否傾向于與內容生產者對事件的情感趨同。

內容生產者識別指標及內容評論者識別指標都為正向指標,其符號僅代表情感的極性或情感變化的方向性,不代表數值大小,具體計算方式見第2.2.1節和2.2.2節。

基于以上定義,在接下來的章節將詳細介紹各指標的計算方法。

2.2.1 內容生產者指標計算方法

內容生產者各指標的定義及計算方法如下:

1)回答長度

內容生產者識別指標體系下利用內容生產者答案的平均字數度量內容生產者回答長度。內容生產者答案的平均字數能夠在一定程度上反映內容生產者撰寫回答的投入的時間和精力?;卮鹞谋鹃L度越長,內容生產者撰寫回答所需的時間和精力越多。回答長度的度量需要使用每條回答長度和回答數,如式(1)所示:

(1)

其中ALj是內容生產者i的平均文本長度,alj是內容生產者i第j篇回答的文本長度,ni是內容生產者i回答問題總數。

2)更新回答特征

更新回答特征利用平均持續更新時間度量某位內容生產者在發布回答后的活躍程度。持續更新時間越長,內容生產者在回答問題后在回答中越活躍。在同一個問題下,內容生產者通常只有1個回答,但該回答可以被修改。因此,用最后一次修改時間和第一次回答問題時間的差值(以分鐘為單位)來計算內容生產者在一個問題上投入的時間和精力。該指標的測量需要使用每個回答持續更新時長和回答問題數,內容生產者的專注度計算公式如式(2)所示:

(2)

其中AFi是內容生產者i的專注度。tj1是第j篇回答最后修改的時間,tj0是第j篇回答第一次發布的時間。ni是內容生產者i回答問題總數。

3)廣泛度

廣泛度可用于度量內容生產者回答問題涉及領域的廣泛性。內容生產者回答問題的數量越多,其涉及的領域就越廣。廣泛度的計算公式如式(3)所示:

AWi=ni

(3)

其中AWi是內容生產者i的廣泛度。ni是內容生產者i回答問題總數。

4)情感強度

情感強度利用回答的平均情感值度量內容生產者回答的情感激烈程度?;谇楦性~典進行文本分析是一種常用的文本分析方法。情感詞典中收錄了情感詞和情感詞的情感值。此外,利用句法依存分析可以得到句子中與情感詞有依賴關系的否定詞和程度詞。否定詞能夠改變情感詞的情感極性。不同的程度詞具有不同的程度值,能夠增強或削弱情感詞的情感值?;诖?,本文將文本的情感值計算公式表述如式(4)所示:

(4)

其中S是所有情感詞的情感值的總和,swi是情感詞wi的情感值,w是情感詞總數,Nwi是與情感詞wi有依賴關系的否定詞總數,Dwj是第j個與情感詞wi有依賴關系的程度詞的程度值。情感強度指標用于分析內容生產者的情感激烈程度。積極情感強度能夠反映內容生產者表述積極情感時的情感強度,計算公式如式(5)所示:

(5)

其中IDPi是內容生產者i的積極的情感強度。alip是回答者i第p篇表達積極情感的回答的長度。Siu是第j第p篇表達積極情感的回答的情感值。kp是內容生產者i的表達積極情感的回答總數。

消極情感強度能夠反映內容生產者表述消極情感時的情感強度,計算公式如式(6)所示:

(6)

其中IDUi是內容生產者i的消極的情感強度。aliu是回答者i第u篇表達消極情感的回答的長度。Siu是回答者i第u篇表達消極情感的回答的情感值。ku是內容生產者i的表達消極情感的回答總數。

綜合情感強度能夠反映內容生產者更多的是表達消極情緒還是積極情緒,綜合情感強度的計算如式(7)所示:

(7)

其中IDi是內容生產者i的綜合情感強度。alij是回答者i第j篇回答的長度。Sij是第j篇回答情感值的絕對值。k是內容生產者i的回答總數。

5)影響范圍

影響范圍利用時間加權的平均評論數度量內容生產者的平均影響范圍。生產者的回答被評論數量越多說明其影響范圍越廣。此外,用戶在閱讀答案時通常不會復習,因此評論者對答案的記憶會隨著時間流逝遺忘。基于此,為了更精準地表示內容生產者當下的影響范圍,引入時間因素對早期的評論者與近期的評論者進行區分。影響范圍的計算公式如式(8)所示:

(8)

其中IWi是內容生產者i的影響范圍,k是回答下的評論數,Tj1是第j條評論的評論時間,T0是當下的時間。

6)情感傳染能力

情感傳染能力能夠反映內容生產者影響他人對事件的情感的能力。本研究將情緒傳染能力分為正向情緒傳染能力、負向情緒傳染能力和綜合情感能力。內容評論者對事件的情感和內容生產者對事件的情感一致時,情緒為正向傳播。內容評論者對事件的情感和內容生產者對事件的情感不一致時,情緒為負向傳播。評論的表現形式包括直接評論和間接評論。直接評論是內容評論者直接在回答下評論的意見表現形式;間接評論是內容評論者評論回答下他人評論的意見表現形式。回答、直接評論和間接評論關系如圖2所示。根據搜集到的評論的對象可以分為對回答者/答案的評論、對事件的評論。評論情感可以分為積極情感和消極情感?;谝陨咸匦?,本研究設計了情感傳染方向的判斷規則,如表2所示。

圖2 回答、直接評論和間接評論關系

表2 情感傳染方向判斷規則

為了判斷情感傳染的強度,本研究定義了情感共振值指標,每條評論的情感共振值的絕對值計算公式如式(9)所示:

(9)

其中|Gij|是第i篇回答下第j條評論的情感共振值的絕對值。|Sij|是第i篇回答下第j條評論的情感值的絕對值。|Si|是第i篇回答的情感值的絕對值。情感值可由式(4)得到。根據表2的規則,當情感傳染方向為正向時,Gij為正數;當情感傳染方向為負向時,Gij為負數。

正向情感傳染能力能夠反映內容生產者令他人和自己對事件的情感趨同的能力,正向情感傳染能力的計算公式如式(10)所示:

(10)

其中TPi是內容生產者i的正向情感傳染能力。Gip是對內容生產者i的第p條情感共振值為正數的評論。ktp是對內容生產者i的情感共振值為正數的評論的總數。

負向情感傳染能力能夠反映內容生產者令他人產生和內容生產者對事件的感情相反的情緒的能力,負向情感傳染能力的計算公式如式(11)所示:

(11)

其中TUi是內容生產者i的負向情感傳染能力。Giu是對內容生產者i的第u條情感共振值為負數的評論。ktu是對內容生產者i的情感共振值為負數的評論的總數。

綜合情感傳染能力能夠反映內容生產者對群體情感的整體影響,計算公式如式(12)所示:

(12)

其中Ti是內容生產者i的綜合情感傳染能力。Gij是第j條針對內容生產者i的評論的情感共振值。k是他人評論內容生產者i的總數量。

2.2.2 內容評論者指標計算方法

內容評論者各指標的定義及計算方法如下:

1)評論長度

內容評論者識別指標體系下利用內容評論者平均評論字數度量評論長度。平均評論字數可以反映內容評論者撰寫評論投入的時間和精力。評論文本越長,內容評論者撰寫評論投入的時間和精力越多。計算平均評論字數需使用評論長度和評論總數,如式(13)所示:

(13)

其中RLi是內容評論者i的平均評論長度,rlj是內容評論者i第j篇評論的文本長度,mi是內容評論者i評論總數。

2)專注度

內容評論者專注度基于平均評論數度量內容評論者針對特定回答的活躍程度。內容評論者的平均評論數越高,專注度越高。專注度的計算需使用評論總數和評論回答數,計算公式如式(14)所示:

(14)

其中RLj是內容評論者i的專注度,mi是內容評論者i評論總數,ki是內容評論者i評論問題總數。

3)廣泛度

內容評論者的廣泛度指標利用評論的回答的數量度量內容評論者關注問題的范圍。廣泛度越高,內容評論者關注問題范圍越廣。廣泛度的三級指標是用戶評論的問題數量,計算方法如式(15)所示:

RDi=ki

(15)

其中RDi是內容評論者i的專注度,ki是內容評論者i評論問題總數。

4)情感強度

情感強度用于度量內容評論者的情感激烈程度。情感強度越大,內容評論者越情緒化。選擇評論文本的情感值的計算情感強度。評論文本的情感值計算方法同式(4)。積極情感強度計算方法如式(16)所示:

(16)

其中REPi是內容評論者i的積極情感強度,Spj是內容評論者i第p條積極評論的情感值,mpi是內容評論者i發布積極評論的總次數。

消極情感強度計算方法如式(17)所示:

(17)

其中REUi是內容評論者i消極情感強度,Suj是內容評論者i第u條消極評論的情感值,mui是內容評論者i發布消極評論的總次數。

綜合情感強度計算方法如式(18)所示:

(18)

其中REi是內容評論者i的綜合情感強度,Sj是內容評論者i第j條評論的情感值,mi是內容評論者i評論他人的總次數。

5)情感回饋

情感回饋可以度量內容評論者是否容易受他人的影響。情感回饋分為正向情感回饋、負向情感回饋和綜合情感回饋。情感回饋的絕對值越大,內容評論者的回饋情緒越激烈。情感回饋指標為正值時,內容評論者與內容生產者對事件的情感趨同;情感回饋指標為負值時,內容評論者與內容生產者對事件的情感相反。情感回饋指標基于式(9)的情感共振值計算。正向情感回饋可以反映內容評論者是否容易與內容生產者對事件的情感趨同,計算公式如式(19)所示:

(19)

其中RPi是內容評論者i的正向情感回饋值。mrp是內容評論者i發布的情感共振值為正數的評論的總數。Gip是內容評論者i第p個為正數的情感共振值。

反向情感回饋可以反映內容評論者產生是否容易與內容生產者對事件的情感相反,計算公式如式(20)所示:

(20)

其中RUi是內容評論者i的負向情感回饋值。mru是內容評論者i發布的情感共振值為負數的評論的總數。Gip是內容評論者i第u個為負數的情感共振值。

綜合情感回饋可以測量內容評論者和內容生產者對同一事件更易產生相同情感還是更易產生相反的情感,計算公式如式(21)所示:

(21)

其中Ri是內容評論者i的綜合情感回饋值。m是內容評論者i發布的評論的總數。Gij是內容評論者i第j條評論的情感共振值。

2.3 用戶畫像及關鍵用戶識別

用戶畫像指提取用戶的精煉特征,對用戶進行標記。聚類分析是一種常用的用戶畫像方法,例如K-means聚類[33]、兩步聚類[34]等方法常用于進行用戶畫像。兩步聚類是一種能夠自動選擇最佳聚類數的聚類方法。用于兩步聚類的數據可以是連續數據,可以是離散數據,也可以是既包含連續數據又包含離散數據的混合數據。

兩步聚類是BIRCH層次聚類的改進方法,包括預聚類和正式聚類兩步。預聚類步驟借鑒BIRCH層次聚類方法,生成聚類特征樹(CF樹)。聚類特征樹的子節點代表聚類特征的組合。利用聚類特征樹,預聚類過程能夠將數據劃分為若干密集的子簇,并在此過程中剔除離群點。

兩步聚類算法利用預聚類中子簇的特征進行正式聚類。在正式聚類階段,利用貝葉斯信息準則確定最佳類別數的大致范圍,隨后以最近簇距離為評判標準確定最佳類別數,并得到最終聚類結果。

本研究利用兩步聚類,分別基于內容生產者識別指標體系和內容評論者識別指標體系進行用戶劃分。隨后,根據聚類結果劃分用戶群體,根據識別指標進行用戶畫像。最后,基于用戶在內容生產和評論中的畫像,綜合分析用戶的特點,實現關鍵用戶識別。

3 實證分析

3.1 實驗數據

《國家突發公共事件總體應急預案》指出,社會安全事件包括恐怖襲擊事件、經濟安全事件和涉外突發事件等[35]。知乎平臺是一個高質量的問答平臺。用戶可以在平臺上自由提問,其他用戶能夠回答該用戶的問題,也可以對回答進行評論。本研究選取知乎平臺,利用Python編寫爬蟲獲取數據。知乎平臺中的問題以標簽劃分類別,本文選擇2011—2019年包含“恐怖襲擊”標簽的問題作為實驗數據,分析識別能影響社會安全的用戶。其中評論19 529條、回答13 759條、用戶15 120名。在去除匿名用戶、已注銷賬戶用戶及其評論與回答后,共得到12 179名用戶、14 959條評論、9 887條回答。

BosonNLP情感詞典是基于微博、新聞等上百萬篇中文語料庫構建的中文情感字典。本文利用百度AI進行句法依賴分析,并利用BosonNLP獲取文本的情感值。兩步聚類能夠自動選擇最佳類別數。因此,可直接利用兩步聚類分別基于內容生產者識別指標體系和內容評論者識別指標體系進行聚類分析,得到具備不同特點用戶群體類別。對兩次聚類的結果進行綜合分析,可以識別關鍵用戶。

3.2 結果及分析

3.2.1 內容生產者畫像

根據內容生產者識別指標體系,利用兩步聚類對內容生產者進行聚類分析,結果如表3所示。兩步聚類能夠自動選擇最佳類別數,由表3可知內容生產者被劃分為4類。表中的括號里的數值為類別指標的平均值。如類別1中第一行的數值“0.641”代表類別1的回答長度的均值為0.641。為了更直觀地表述不同類別內容生產者的差異,將指標的平均值的絕對值劃分為高、較高、較低、低4檔。

表3 基于內容生產者識別指標體系的聚類結果

類別1代表用戶無回答行為或回答次數極少,這一類用戶劃分為低產出內容生產者。

類別2代表有回答行為,但影響力較低的普通內容生產者。該類內容生產者撰寫的文本字數較少,持續更新答案的時間較短,回答問題的數量也較少,影響他人的范圍較小。回答表達的積極情感強度和消極情感強度都較高,說明回答表達的情緒較為激烈。綜合情感強度較低,且為負數,表明該類內容生產者更傾向于表達消極情緒。該類內容生產者的正向情感傳染能力和負向情感傳染能力都較高,綜合情感傳染能力較低且為正數。這說明該類內容生產者容易引發他人較強的正向及負向的情感波動,且整體而言更易令他人的情感與內容生產者自身趨同。

類別3代表積極生產內容但內容具有爭議的爭議內容生產者。此類內容生產者撰寫的文本字數較多,持續更新的時間長,回答問題的廣泛度高,影響他人的范圍較廣?;卮鸬姆e極情感強度和消極情感強度都為高,綜合情感強度較高。這說明回答蘊含強烈的消極情感或積極情感,且整體而言蘊含積極情感的回答更多。正向情感傳染能力和負向情感傳染能力都為較低,但綜合情感傳染能力為較高且為負數。這說明該類內容生產者具備一定影響他人對事件的情感,但多數人與該類內容生產者對事件的情感不同。

類別4代表優質內容生產者。此類內容生產者撰寫的文本字數較多,持續更新的時間較長,回答問題的廣泛度較高,影響范圍廣?;卮鸬姆e極情感強度和消極情感強度都為較低,綜合情感強度較高。這說明其回答中蘊含的情緒較少,相對其他類別用戶的回答更加客觀,且多為積極情感。該類內容生產者的正向情感傳染能力和負向情感傳染能力都為高,綜合情感傳染能力高且為正數。這說明其能夠影響他人對事件的情感,且大多數人與該類內容生產者對事件的情感趨同。

綜合以上分析,用戶能夠被劃分為四大類:非內容生產者(類別1)、普通內容生產者(類別2)、爭議內容生產者(類別3)和優質內容生產者(類別4)。在輿情引導工作中,優質內容生產者可以起到良好的作用,有關部門可以加強與該類用戶的合作。此外,爭議內容生產者有積極生產內容的意愿,其生產的內容雖然具有爭議,但經過適當引導、培訓能夠轉換為優質內容生產者。

3.2.2 內容評論者畫像

根據內容評論者識別指標體系,利用兩步聚類對內容評論者進行聚類分析,結果如表4所示,兩步聚類能夠自動選擇最佳類別數,由表4可知,內容評論者被劃分為4類。表中的括號里的數值為類別指標的平均值。為了更直觀地表述不同類別內容評論者的差異,將指標的平均值的絕對值劃分為高、較高、較低、低4檔。

表4 基于內容評論者識別指標體系的聚類結果

類別1代表評論問題較少,評論數量較多的專精內容評論者。該類內容評論者撰寫評論的長度較短,專注度高,廣泛度低,也就是說該類內容評論者多針對少量的問題進行大量的評論。此外,該類內容評論者積極情感強度較高,消極情感強度較高,綜合情感強度較高且為正數。這說明該類內容評論者表達的情緒較為激烈,且多為積極情緒。該類內容評論者正向情感回饋和負向情感回饋為較高,綜合情感回饋為較高且為正數。這說明該類內容評論者對事件的情緒與內容生產者對事件的情緒有程度較高的趨同或相反,且大部分情況下與內容生產者對事件的情緒一致。

類別2代表普通內容評論者。該類內容評論者撰寫評論的長度較長,專注度低,廣泛度高,也就是說該類內容評論者沒有明確的內容偏好。此外,該類內容評論者積極情感強度較低,消極情感強度較低,綜合情感強度趨近于0。這說明該類內容評論者的情緒較為平靜。該類內容評論者正向情感回饋和負向情感回饋為較低,綜合情感回饋為較低且為正數。這說明該類內容評論者對事件的情緒與內容生產者對事件的情緒有程度較低的趨同或相反,且大部分情況下與內容生產者對事件的情緒一致。

類別3代表鈍感內容評論者。該類內容評論者撰寫評論的長度最長,專注度低,廣泛度較低,也就是說該類內容評論者沒有明確的內容偏好,但會用心地進行評論。此外,該類內容評論者積極情感強度低,消極情感強度低,綜合情感強度趨近于0。這說明該類內容評論者的情緒十分平靜。該類內容評論者正向情感回饋和負向情感回饋為低,綜合情感回饋為低且為正數。該類內容評論者正向情感回饋和負向情感回饋為較低,綜合情感回饋為較低且為正數。這說明該類內容評論者對事件的情緒受內容生產者對事件的情緒的影響較小。

類別4代表敏銳內容評論者。該類內容評論者撰寫評論的長度短,專注度較高,廣泛度高,也就是說該類內容評論者沒有明確內容偏好,且會多次在同一個回答下進行評論。此外,該類內容評論者積極情感強度較高,消極情感強度高,綜合情感強度高且為正數。這說明該類內容評論者表達的情緒較為激烈,且多為積極情緒。該類內容評論者正向情感回饋和負向情感回饋為高,綜合情感回饋為高且為正數。這說明該類內容評論者對事件的情緒與內容生產者對事件的情緒有程度極高的趨同或相反,且大部分情況下與內容生產者對事件的情緒一致。

綜上基于內容評論者識別指標體系將用戶劃分為專精內容評論者(類別1)、普通內容評論者(類別2)、鈍感內容評論者(類別3)和敏銳內容評論者(類別4)。專精內容評論者有明確的內容偏好,內容服務平臺和行業組織應注重對專精內容評論者的內容推送。在進行輿情管理時,相關部門應更加注意敏銳內容評論者,因為此類用戶更容易被他人引導,誤信謠言等虛假信息的風險更大。

3.2.3 綜合分析

在根據內容生產者識別指標體系和內容評論者識別指標體系對用戶分別進行劃分后,結合用戶在兩個指標體系中的不同聚類結果,本節對用戶在網絡中的特點進行分析,劃分結果如表5所示。

表5 結合內容生產和評論的用戶分析 %

結合用戶在兩個指標體系中的分類,本研究將用戶劃分為6個類別。如表5所示,84.8%的用戶為積極內容評論者,該類用戶基本沒有內容生產行為,主要進行評論行為且其活動造成社會危害的可能性較低。11.5%的用戶為中堅用戶,大部分內容生產者屬于該類,該類用戶既是內容生產者也是內容評論者,其生產的內容對他人的影響較小。2.2%的用戶為潛在優質用戶,該類用戶既是內容生產者也是內容評論者,但其生產的內容具有較大的爭議。經過恰當的引導和培訓,該類用戶有可能轉化為優質用戶。0.37%的用戶為優質用戶,該類用戶既是內容生產者也是內容評論者,其生產的內容對他人的影響較大。此外,93%的優質內容生產者是鈍感內容評論者,而且鈍感內容評論者都不是優質內容生產者。這說明相比于其他用戶,理智冷靜的用戶更容易成為優質內容生產者。0.97%的用戶是風險用戶,該類用戶對事件的情緒容易被他人影響且情感波動較大。0.025%的用戶是高風險用戶,該類用戶不僅自身情緒易被他人影響,同時也生產具有爭議的內容,影響他人對事件的情緒。此類用戶可能更易受他人影響而傳播虛假信息。

4 結 論

為了幫助相關部門更好地進行輿情引導,促進民眾參與維護國家安全,本文構建內容生產者識別指標體系和內容評論者識別指標體系。基于以上指標體系,利用兩步聚類算法進行用戶畫像。從內容生產的角度,用戶被劃分為非內容生產者、普通內容生產者、爭議內容生產者和優質內容生產者。從內容評論的角度,用戶被劃分為專精內容評論者、普通內容評論者、鈍感內容評論者和敏銳內容評論者。部分用戶既是內容生產者也是內容評論者。因此,本文基于內容生產者的用戶畫像結果和內容評論者的用戶畫像結果,對用戶進行綜合分析。用戶被劃分為積極內容評論者、風險用戶、高風險用戶、中堅用戶、潛在優質用戶和優質用戶。

本研究有助于相關部門進行輿情引導,及時防范風險。相關部門應注意優質用戶、風險用戶和高風險用戶。與優質用戶合作,相關部門可以更好地促進民眾參與維護國家安全。此外,風險用戶和高風險用戶易被他人影響,相關部門也應當注意引導該類用戶。相關部門應特別關注高風險用戶對事件的情感傾向,避免其傳播虛假信息。本研究對于內容服務平臺和行業組織也有幫助。內容服務平臺能夠根據用戶特點,為用戶制定個性化服務,行業組織能基于用戶特點制定發展規劃,建立良好的社交媒體生態。本文提出的分析框架也能夠為之后的關鍵用戶識別提供參考。本研究僅對在知乎平臺上“恐怖襲擊”相關數據進行研究,在今后的研究中可以考慮采用不同平臺或不同主題的數據進行研究。

致謝

感謝圖書情報國家級實驗教學示范中心為本研究提供的實驗支持!

猜你喜歡
內容情感用戶
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 欧美精品不卡| 成人综合久久综合| 国产精品永久久久久| 日本久久久久久免费网络| 伊人狠狠丁香婷婷综合色| 91在线播放国产| 五月天综合网亚洲综合天堂网| 久久青草精品一区二区三区| 亚洲欧洲日韩国产综合在线二区| 国产精品综合色区在线观看| 欧美啪啪网| 亚洲永久精品ww47国产| 国产噜噜噜| www.99在线观看| 亚洲日韩AV无码一区二区三区人| 亚洲女同欧美在线| 久久精品亚洲专区| 久久精品一品道久久精品| 在线毛片免费| 午夜激情福利视频| 免费无码网站| 亚洲精品亚洲人成在线| 精品五夜婷香蕉国产线看观看| 91丝袜乱伦| 好紧太爽了视频免费无码| 91外围女在线观看| 免费国产高清视频| 免费高清毛片| 凹凸精品免费精品视频| 毛片视频网| 色AV色 综合网站| 精品精品国产高清A毛片| 露脸一二三区国语对白| 亚洲国产成人精品一二区| 久久青青草原亚洲av无码| 精品色综合| 成年人国产视频| 一级毛片免费高清视频| 亚洲欧美日韩另类| 国产综合另类小说色区色噜噜 | 日韩成人高清无码| 无码一区二区三区视频在线播放| 精品国产网站| 日韩成人午夜| 久久婷婷综合色一区二区| 久久亚洲中文字幕精品一区 | 国产一国产一有一级毛片视频| 久久国产亚洲偷自| 婷婷综合色| 国产主播在线一区| 亚洲码一区二区三区| 人人看人人鲁狠狠高清| 波多野结衣一二三| 国产毛片久久国产| 欧美中文字幕在线二区| 91在线丝袜| 天天色天天综合网| 伊人欧美在线| 亚洲精品天堂自在久久77| 午夜欧美理论2019理论| 久久久精品国产亚洲AV日韩| 亚洲欧美日本国产综合在线| 亚洲成人高清无码| 免费看美女自慰的网站| 国产日韩精品欧美一区灰| 久99久热只有精品国产15| 亚洲中文字幕23页在线| 国产亚洲精品无码专| 亚洲精品成人7777在线观看| 无遮挡国产高潮视频免费观看 | 一级成人a做片免费| 无码专区在线观看| 国产精鲁鲁网在线视频| 国产办公室秘书无码精品| 丰满的熟女一区二区三区l| 呦女精品网站| 国产精品对白刺激| 国产亚洲精品97在线观看| 2021国产精品自产拍在线| 久久久久亚洲AV成人人电影软件| 国产日本视频91| 国产无码制服丝袜|