摘 要:互聯網的飛速發展使得網絡成為了發表觀點的主要陣地,意見領袖對網絡輿情的導向起著重要的推動作用,快速準確的發現意見領袖具有重要的現實意義。本文列舉并剖析了統計學方法、社會網絡結構分析法和聚類分析法三種常用的發現方法,比較了各自的優缺點,為進一步研究輿情分析奠定了基礎。
關鍵詞:輿論;意見領袖;數據挖掘;聚類
中圖分類號:O242.1;G206 文獻標識碼:A 文章編號:1674-7712 (2014) 14-0000-01
意見領袖(Opinion Leader)又稱為“輿論領袖”,是指在人及傳播網絡中經常為他人提供信息,同時對他人施加影響的“活躍分子”,這個概念最早是由美國傳播學者拉扎斯菲爾德在20世紀40年代提出的,最初被用來研究政治投票、市場營銷等領域的人際影響力。
一、統計學方法
第一種方法我們稱之為傳統統計學方法,使用這種方法來發現網絡輿論意見領袖可以說是目前眾多方法中最直接、最方便的方法了,該方法基于一個普遍認同的邏輯,即所謂的意見領袖必然是網絡輿論中與他人交互最多的人,比如論壇中的回帖,微博中的“@”等,以網絡用戶的入度為例,度值較高的用戶就是網絡中與他人交互最多的人,他的發言大家最感興趣,他的話題大家都愿意參與,他的意見大家都愿意接受,所以這個用戶是網絡輿論意見領袖的可能性就非常大。使用這種方法確定意見領袖只需要統計網絡用戶的度,進行簡單排序,排序在前面的用戶就是意見領袖。如果在發現精度要求不高的情況下,使用該方法是最為便捷的。
第二種方法我們稱之為參數統計學方法,在網絡中網站為了管理要求,會設置很多的用戶參數,比如用戶的在線時間,用戶的好友數,用戶的評論或回復數等,這些參數可以從側面反映用戶在網絡中的身份,例如用戶在線時間較長,說明用戶對該區域比較感興趣;用戶的好友較多,說明用戶在網絡中的受擁護程度較高;用戶的評論數較多,說明用戶與他人的交互較多等等。這種方法可以綜合使用多種參數,將需要的參數值加權處理,然后進行排序,排序在前面的用戶就是意見領袖。
二、社會網絡結構分析法
基于社會網絡分析(SNA)的發現方法是根據隨機圖理論、六度分割理論、小世界網絡理論形成的復雜網絡理論,它將用戶看做節點,將用戶之間的關系看作邊,用戶和用戶之間的關系就構成了社會網絡。基于社會網絡分析的發現主要利用節點重要度的指標,衡量某節點在網絡的中心地位,其中點中心度、中間中心度和接近中心度是又是衡量節點重要度的指標。通過這些中心度方法對網絡進行分析,就可以得到網絡中最重要的節點,即意見領袖。目前,SNA的發現方法主要依據類似PageRank等排名算法對節點進行等級排名計算。
基于SNA的意見領袖發現方法的有點在于從全局角度分析節點,能定量的分析節點在網絡中的關鍵性,方法靈活多變,非常適合網絡不斷變化的情況,能達到很好的發現效果。缺點在于不重視節點本身,最終取得的結果可靠性有待提高。
三、聚類分析法
在目標屬性較多的情況下,統計學方法和SNA方法就顯得力不從心了,此時就需要采用聚類的方法對屬性聚類以達到發現意見領袖的目的。聚類分析(Cluster Analysis)是一種對數據或樣品進行分類的多元統計方法。一般進行聚類的步驟是首先將整個樣本看成一個多維空間,采用聚類算法將空間中的樣本進行聚類,最接近意見領袖的那一類就是目標類,目標類中的樣本點就是意見領袖。目前聚類的方法主要有:劃分方法、基于密度的方法、層次方法、基于模型的方法、基于網格的方法等。
聚類方法進行意見領袖發現通常比較容易理解,操作起來也較為方便,但由于聚類方法一般都是高維,對于數據量較大的樣本,算法效率受到極大限制。
參考文獻:
[1]余重遠,李珊,趙文.基于SNA的網絡輿論領袖確定法法研究[J].科技信息,2011(12):36-39.
[2]肖宇,許煒,夏霖.網絡社區中的意見領袖特征分析[J].計算機工程與科學,2011(01):150-156.
[3]陳然.網絡論壇意見領袖的識別方法與原則[J].媒體時代,2012(09):33-36.
[作者簡介]陳藝卓(1983.06-),碩士,海南軟件職業技術學院講師,研究方向:數據挖掘。
[項目名稱]2014年海南省高等學??茖W研究項目《基于數據挖掘的高校網絡輿情分析研究》(項目編號:HNKY2014-97)。