林自展,肖井華,周金連,吳 曄*
(1.北京郵電大學理學院 北京 海淀區 100876;2.北京師范大學新聞傳播學院 北京 海淀區 100875)
在互聯網時代,每個人不僅是社會信息的消費者,同時也是信息的生產者和觀點的傳播者[1]。在線點評作為一種個體觀點表達的方式,指用戶或者消費者通過線上平臺直接對商品或服務評分并發布評論。這種直接的觀點表達,將作為一種反饋信息,為下一個潛在消費者的行為決策提供參考。因此研究點評平臺中群體意見分布的觀點動力學機制,既可以進一步了解個體線上點評的行為規律,也可以為商家保持良好口碑提供參考。
目前,關于個體在線點評觀點動力學的研究主要采用多主體建模的方法對點評意見分布進行解釋或預測。文獻[2]認為個體在觀影后發表影評時容易受到電影質量、其他用戶評分以及自身評分習慣的影響,基于此建立了關于電影評分的理論模型,并使用豆瓣影片在線點評數據進行驗證,該模型可以較好地預測影片評分的意見分布。與預測評分意見不同的是,文獻[3]則通過建立連續觀點的動力學模型,通過判斷個體是否會選擇發表評分,從而預測在線點評的人數發展趨勢。文獻[4]則是針對電子商務環境下,基于個體時間與精力的有限性、個人對他人觀點的信任程度、發表評論的概率及現有的歷史評論等影響因素,構建出在線點評意見演化動力學模型。通過仿真模擬實驗的方式,分別討論了上述的各個因素對最終意見群體演化結果的影響。
目前主流的觀點動力學模型歸為離散模型和連續觀點模型兩個大類。在離散模型中,個體的觀點只有贊成和反對兩種情況。Sznajd模型[5]、Majority rule模型[6]和Voter模型[7]是離散模型的典型代表。實際上個體的觀點并不能簡單地歸結于0和1兩種情況,在連續模型中,個體的觀點值是一定范圍內的連續數值,基于有界信任的Deffuant模型[8]和Hegselmann-Krause模型[9]是最具代表性的兩個模型。這兩個模型用[0,1]區間內的連續數值來表示個體的觀點值,只有在觀點差值小于閾值的情況下,兩個個體之間才會發生意見交流,并互相產生影響。在Deffuant模型中每次選擇兩個個體進行觀點交互,與Deffuant模型的不同點在于,HK模型中的個體會受到群體中所有滿足觀點差值小于閾值的其他個體的觀點的影響,并以此來更新自己的觀點值。目前,關于輿論動力學的研究主要是在傳統的Deffuant模型和HK模型的基礎上,從社會網絡結構[10-15]、評論文本挖掘[16-17]、個體特征[18]等角度進行研究。
伴隨著在線點評平臺的快速發展,越來越多的學者基于觀點動力學在社交網絡的基礎上研究用戶行為特征以及輿論傳播的演化過程。然而,在線點評行為與傳統的輿情演化相比存在明顯的差異,主要包括以下幾個方面:1) 在傳統的輿論研究中,人群中任意兩個人都有可能發生觀點交互并互相影響對方的觀點。但在線點評中,通常只能看到前人的評論,而前人并不會受到即將發表的評論的影響。因此,在線點評下個體間的影響是基于時間順序的單方面影響。2) 基于社交網絡的輿論演化研究,是在復雜網絡的基礎上考慮節點多樣性、連接多樣性、網絡結構復雜性等。而在線點評模式下是多個前人對后續評論者的單向影響,即單向網絡結構。3) 社交網絡下,個體間的交流可以發生在有人際關系連邊的好友,也可能是發生在有共同好友的兩個個體之間。而在在線點評平臺上,通常是按照評論發表時間的先后順序進行展示,只有近期的少部分評論會對用戶產生影響。
本研究基于上述在線點評與傳統輿論傳播的差異性,對傳統的HK模型進行部分針對性的修改,并探究在線點評中所蘊含的觀點動力學機制。
在線點評行為常見于淘寶、京東、當當等各大電商平臺,其中大眾點評是中國最大的在線點評平臺之一。用戶可以在大眾點評平臺上發布自己對商家的評論,同時他們也能夠瀏覽其他用戶的點評輔助消費決策。
本研究選取了大眾點評平臺上2012年12月至2015年1月用戶的歷史評論數據,共包括3.8萬個商家,共330萬條歷史評分記錄。從中篩選出評分數量超過500條的店鋪,剩余1 610個商家,205萬條歷史評分數據。每一條評分數據由星級、口味、環境、服務組成,均是[10,20,30,40,50]分,以這4種評分的均值作為店鋪的整體評分。極端的評論會影響實際數據的真實性和準確性,因此50分的極端評分在這里并不考慮,原因是:1)雇傭水軍模擬正常消費者的評論,提升整體平均分,吸引更多的人到店消費是商家常用的手段[19];2)未發表評論系統默認打分為滿分50;這兩種情況不能反映真實的用戶體驗。
通過觀察500條以上店鋪的評分分布情況,可以將其歸類為單峰模式和雙峰模式兩大類。單峰模式即店鋪的評分呈現出單一意見群體,雙峰模式則存在兩個對立的意見群體。本文分別從這1 610家店鋪中挑選了兩種模式下具有代表性的3個不同店鋪,實際的評分分布如圖1所示。
傳統HK模型是在Deffuant模型的基礎上演化出的一種基于有界信任的連續動力學模型,目的是研究群體中個體觀點的演化過程。假設在一個群體中,存在N個個體,用表示個體i在t時刻自身的觀點值,同時在t時刻,個體i會在群體中與其他個體進行交流,發生觀點間的交互,如果個體j與個體i的觀點差值小于觀點閾值d,即那么個體j的觀點會對個體i的觀點產生影響,反之則不會有影響。個體i在與其他個體發生觀點交互后,其觀點值的更新如下:
式中,收斂參數μi表示個體對其他個體觀點值的信任程度;觀點閾值d表示只有在觀點閾值內的個體觀點才會對個體i產生影響;權重表示個體j對個體i的影響程度,且
在線點評觀點傳播的特點與HK模型并不完全相同,其傳播過程如圖2所示。基于在線點評模式觀點傳播的特點,本文在HK原始模型的理論基礎上針對以下三個部分進行了調整,使得新模型能夠適用于在線點評模式下的觀點演化模式。
1) 在HK模型中,基于社會人際關系復雜網絡,個體之間的觀點交互只在有關系的個體間發生,即只有兩個節點之間存在關系連邊,且觀點差值小于閾值才會發生兩者間的觀點交互。然而在在線點評中,用戶之間的社會網絡關系并不明顯,個體間的觀點交互是基于評論時間先后順序的,只有后發表評論的人才能看到已有的評論。因此,本文將社會人際關系網絡結構轉變為基于時間先后順序的單向網絡結構。
2) 在線點評店鋪中存在大量的歷史評論,且網頁上每次僅只會顯示幾十條評論,由于決策的時間有限,不能看完所有的歷史評論,只有近期的評論數據會對用戶觀點產生直接的影響。假設最近的K條評論會對用戶的觀點有影響。
3) 不同個體之間的信任程度不一致。傳統的HK模型通過產生一個隨機數作為兩個個體間的信任值。大眾點評中,用戶更傾向于相信近期的評論。在觀點差小于閾值d的前提上,發表時間越近的評論對當前用戶的評分所造成的影響程度越大。這里用表示第j條評論對第i條評論的影響程度。
綜上所述,個體觀點值的更新如式2所示,其中i表示當前新增的評論為評論序列的第i條,表示第i條評論的初始觀點,服從[0,1]之間的均勻分布,μ表示收斂參數。
根據大眾點評的實際情況,本文基于傳統HK模型進行修正,提出了適用于在線點評模式中的新模型,并對比分析了每一個參數對最終仿真結果所造成的影響。
意見群體的形成與K值的大小緊密相關,如圖3所示。當K值較小時,也就是用戶閱讀的評論數較少,即只有少部分評論會影響到用戶的評分,K值越小說明用戶受到其他用戶的影響越小,那么用戶之間就很難形成意見群體。隨著K值的增大,越來越多的評論會影響到用戶,那么用戶就容易與周圍其他用戶的意見達成一致,最終形成了意見群體。從圖中可以看到,當K值大于10時,最終的結果并不會隨著影響用戶的評論數量的增加而產生明顯的差異。
觀點差閾值d表示的是只有兩個個體間的觀點差值小于d,才會彼此互相影響。如圖4所示,如果任意兩個用戶之間都無法對對方產生影響,即當d=0時,隨著時間的推移,最終是評分區間內均勻分布的結果。當閾值d逐漸增大時,部分觀點差較小的用戶之間開始相互影響,且閾值d越大,兩個用戶之間越有可能會相互影響,向對方的意見靠近趨于一個中間值。此時會形成兩個不同的意見群體,形成兩種截然不同的對立意見。當d值足夠大即d>0.5時,觀點差異較大的用戶之間也會相互影響,大量用戶互相交流影響,最終形成一個統一的意見。
收斂參數μ表示個體受到他人觀點的影響程度。如圖5所示,μ值較小時用戶堅信自己的觀點是正確的,無論他人的觀點與自身差異的大小,都不會輕易采納他人的觀點。隨著μ值的增大,用戶逐漸開始接受他人的觀點。在受到周圍其他用戶的影響后,觀點差異較小的用戶之間達成統一意見,最終形成兩種對立的意見群體。
以上3個仿真結果表明,個體參考評論數K、觀點閾值d和收斂參數μ均會對在線點評的演化結果產生重要的影響。其中,最終形成意見群體個數是由觀點閾值d的大小所決定的。本文在大眾點評實際評分數據分布中觀察到的單峰、雙峰兩種模式與最終的仿真結果一致。
以大眾點評、淘寶、京東、豆瓣等為代表在線點評平臺的興起,為消費者提供了發表個人消費體驗的平臺,同時也使得其他后續的消費者能夠參考他人的評論便于自身更好地做出消費決策。傳統的輿論動力學模型在社會人際關系網絡的基礎上探究觀點演化的內在機制。然而,在線點評平臺上用戶之間的社交關系十分單薄,用戶之間通常不存在任何社交關系,無法構建出有效的社會人際關系網絡,因此傳統輿論動力學模型對于在線點評上的觀點演化存在明顯的缺陷。本文從以下兩個方便針對HK模型進行修正:1) 將社交關系網絡替換為以時間先后為順序的多對一的中心網絡結構;2) 將個體間的信任程度與發表評論的時間間隔因素結合。仿真結果表明,參考評論數量K、觀點差閾值d以及收斂參數μ三者是影響最終意見群體演化結果的主要因素。后續的研究可以針對不同點評店鋪的實際情況,更深入分析各個參數,進一步豐富模型。