卓四清 馮永洲
(武漢大學經濟與管理學院,湖北武漢 430072)
?
在線評論有用性影響因素實證研究
——基于Tripadvisor.com酒店評論數據
卓四清 馮永洲*
(武漢大學經濟與管理學院,湖北武漢 430072)
隨著互聯網的迅速發展,消費者購物決策越來越依賴于在線評論。從信息接受模型對信息有用性影響出發,構建在線評論有用性投票增量的時間窗,建立在線評論有用性影響因素模型,研究在線評論內容和評論者對在線評論有用性的影響。基于TripAdvisor.com的4 258條酒店評論數據,運用負二項回歸進行實證分析。研究發現評論內容長度、評論極端性、評論有用性投票數、評論者認可度和個人信息披露對在線評論有用性具有顯著正影響,這對在線零售商和消費者具有重要的啟發和建議。
在線評論;評論有用性;負二項回歸;大數據
隨著互聯網的迅速發展,電子商務憑借其快捷、方便和低成本優勢已占據著重要地位,越來越多的消費者通過網上購買商品和服務。基于互聯網的高效性、共享性、匿名性等特點,消費者愿意將產品的特征描述、購物后的使用體驗發表在博客、論壇或第三方評論網站上,與他人分享商品使用心得,即消費者在線評論。越來越多的人在網絡購物時將其他消費者發表的在線評論作為購物決策的重要參考。在線評論作為網絡口碑的重要形式,逐漸替代了傳統的商品口碑。據德勤咨詢調查顯示,閱讀并發表商品評論的網絡購物者占總人數的63%,71%的用戶樂意選擇購買帶有網上在線評論的商品和服務。消費者越來越依賴于在線評論作出購物決策,對產品和品牌的認知態度受到在線評論的巨大影響,在線評論已成為影響消費者進行購買決策的關鍵因素[1-2]。在線評論不僅能夠幫助企業樹立良好的品牌形象,也是銷售的重要宣傳方式。因此,在大數據日趨成熟的時代,對于海量在線評論數據的挖掘和運用,預示著新一波生產率的增長和消費者盈余浪潮的到來。
根據消費者購買決策理論,購物決策過程包括5個階段:需求認知、搜索信息、評估方案、購買決策和購買后評價。為了減少不確定性,增強購買信心,消費者會盡可能搜索相關的產品信息。但對于海量的在線評論,什么樣的評論對消費者購物決策具有參考價值?為了解決信息過載的問題,許多電商和第三方評論網站開發了信息評估系統,消費者可以對在線評論進行有用性投票。例如,每條在線評論后面,TripAdvisor.com會問“這條評論對您有用嗎?”,亞馬遜還會在評論旁邊提供評論有用性的參考信息(如“30/50人認為此評論有用”)。這些有用性投票成為診斷評論信息的指標,作為提示用戶過濾信息的信號,以提高用戶決策效率[2-4]。
目前,對在線評論有用性的研究存在諸多缺陷。首先,幾乎所有研究者將有用性投票數占總投票數的百分比作為有用性的測度標準。但對于只提供了在線評論有用性投票數,而沒有提供總投票數的網站則不能用這種方法來度量,以前的研究沒有為這種情況構建理論模型來測度和解釋有用評論的影響因素。其次,百分比會隱藏一些重要的信息,比如,“50/100人認為此評論有用”和“500/1000人認為此評論有用”應該具有不同的解釋。第三,過去的研究大多聚焦于在線評論本身,少有學者將評論內容和評論者結合起來。鑒于此,本文在前人研究的基礎上建立了在線評論有用性影響因素概念模型,并基于TripAdvisor.com酒店評論數據,從評論內容和評論者特征兩個信息源維度出發,進行實證研究在線評論有用性影響因素。
1.1 國外研究現狀
消費者在購物決策中,如果受到在線評論的影響,則會對商品和服務的原有認知發生改變或者認同,該評論對消費者就具備了有用性。Mudambi和Schuff借鑒信息經濟學中搜索型商品和體驗型商品范式,建立了在線評論有用性的概念模型,通過對2類6種產品的1 587條評論研究發現,產品類型、評論深度和評論極端性會對在線評論感知有用性產生影響[2]。Forman的研究表明,評論長度對在線評論有用性具有正向影響,搜索型商品比體驗型商品這種影響作用更強[8-9]。Korfiatis發現,評論極端性與有用性呈正相關關系,尤其是對于體驗型商品,評論極端性的影響更為明顯[10]。Ghose和Ipeirotis采用文本挖掘方法和回歸統計技術,將評論類型作為調節變量,并把評論文本的可讀性、極端性和評論發表時長作為模型的影響因子,運用計量經濟學的方法建立回歸模型,預測文本的有用性[7]。
Forman和Ghose研究亞馬遜網站上的評論發現,在線評論的發布者提供的與自己身份有關的信息,可作為消費者購買決策和評估有用性的補充信息,在線社區中的消費者對包含評論源身份信息的評論有較高的評價,消費者非常注重評論信息發布者的特征[8]。Pan Yue等人發現評論者的特征對評論有用性也有影響。評論者暴露越多有關個人的信息,其評論對其他消費者購物決策的影響越大[9]。
1.2 國內研究現狀
彭嵐等人從傳播說服理論的視角構建在線評論有用性影響因素模型,他們從信息本身、信息發送者、信息接收者和信息反饋4個維度出發,發現評論等級、好評率、評論長度和互聯網使用經驗對在線評論有用性具有重要影響[11]。郝媛媛在改進Ghose等人研究的基礎上,把研究對象鎖定在體驗型商品領域,以影評數據為對象研究在線評論有用性的影響因素,發現評論長度和評論發表時長對評論有用性具有正向影響[6]。祝珊以社會網絡理論為基礎,利用社交網站上的在線評論數據,研究了評論內容和評論者對在線口碑的有用性影響,發現評論極端性、評論長度、評論者受關注度和歷史評論數量對在線口碑有用性具有重要影響[12]。
2.1 理論模型
根據Sussman和Siegal提出的信息接受理論模型(圖1),信息內容質量和信息源可靠性是影響消費者對在線評論感知有用性的直接因素[14]。由于在線評論具有匿名性,信息內容質量和信息源可靠性是減少消費者感知風險的關鍵因素。

圖1 信息接受模型
消費者作出購物決策前處于信息不對稱的條件下,通過閱讀在線評論以獲取關于商品和服務的信息,從而來減少決策風險和損失,這構成研究在線評論有用性影響因素的邏輯起點[5,13]。通過對前人研究的總結,本文考慮評論內容和評論者特征,構建了在線評論有用性影響機制模型(圖2)。該模型主要考慮了評論內容方面的評論長度、評論極端性和有用投票數的影響,以及評論者的個人信息披露和評論者認可度兩個方面。

圖2 在線評論有用性模型
2.2 研究假設
2.2.1 評論內容特征
消費者在線評論包含數字評論和開放式文本評論。開放式文本評論是評論者購買使用商品或服務后對該產品的語言描述、用戶體驗或購買建議。此外,在線評論系統也提供了以星級(1~5星)的形式給產品或服務評分,將評論分為5個星級。低星級評分(1星)代表對商品或服務的極端差評,高星級評分(5星)代表對商品或服務的極端好評,3星為中性評論。張小泉等研究了評論效價和評論長度對在線評論有用性的影響,表明評論效價和評論長度對在線評論有用性具有顯著正影響[9,19]。消費者可以通過評論評分來直接判斷商品好壞,以此減少不確定性,增強購買信心[2,16]。星級評分代表了消費者對產品或者服務的總體態度,在一定程度上反映了在線口碑的評論效價[20]。評論長度能夠增強信息的診斷性,在線評論越長,消費者在不需要花費額外的時間和物質成本情況下,能夠獲得更多的商品信息,在線評論的感知有用性就會更高。Mudambi和Schuff認為信息深入性能夠增強消費者的信心,從而促進消費者的購買決策過程[2]。根據馬太效應,當一個評論獲得較多的有用性投票時,那么它后續獲得有用性投票數的可能性更大。因此作出如下假設:
H1a:評論長度對在線評論有用性具有顯著的正影響。
H1b:評論極端性與評論有用性正相關,極端評論比中性評論更有用。
H1c:評論的有用投票數對評論有用性具有顯著正影響。
2.2.2 評論者特征
根據信息接受模型,評論者提供的有關個人信息也會影響消費者對產品或服務的評估[9]。傳統的社交是熟人間面對面的交流,建立在相互信任的基礎之上。在虛擬的網絡環境下,消費者之間通常都是陌生人,只能根據評論者發出的信息和暴露的個人信息來判斷信息真實性。評論者提供的個人信息越充分,該評論者暴露商品有用信息的可能性就越大,有利于消費者作出準確的購物決策[9]。評論者將個人信息展示出來,可以給消費者更多的信息,讓消費者從信息源上建立自信。評論者評論數量也是衡量其評論經驗的指標,參與評論的數量越多,網購經驗越豐富,其發表的評論會更加專業,從而得到更多的消費者認可。基于社會心理學,Forman研究了評論者個人信息暴露,如真實姓名和住所對其在同行中的認可度的影響,以及個人信息暴露和評論效價對有用性的交互影響[8]。本文對評論者的兩個重要特征做出如下假設:
H2a:暴露個人信息的評論者發表的評論有用性更高。
H2b:評論者的評論認可度與在線評論有用性顯著正相關。
3.1 數據收集
為驗證上述模型和研究假設,本文以TripAdvisor.com上的酒店在線評論作為研究對象。首先,TripAdvisor.com是全球最大的旅游網站,擁有超過1 000萬的注冊會員以及15 000多萬條評論,可以得到大量的評論數據,保證對海量數據的需求。其次,作為第三方評論網站,旅行者的真實評論是其最大特點,從而保證在線評論數據的質量和真實性,以便得出科學研究結論。
通過LocoySpider從網站上獲取相關數據,為了計算有用性投票數的增量,讓設計科學合理、數據收集分為兩個階段。第1個階段(2014年9月),收集了需要的所有相關指標,每條評論數據都包含以下變量:(1)星級評分:消費者對產品的星級評分(1~5星);(2)評論長度:評論文本的字數;(3)有用投票數:該條評論獲得有用性投票數;(4)每條評論的評論者年齡和性別(如沒有則為0);(5)每個評論者的總評論數量和總計有用性投票數量;(6)每條評論發布的時間。第2階段(2014年10月),收集了第1階段已經得到的評論對應的有用性投票數。
3.2 變量設計
3.2.1 因變量
TripAdvisor.com對每一條評論后面的問題“這條評論對您有用嗎?”提供了一個選項“Yes”,統計了在線評論的有用性投票數量。有用性投票數在某種程度上反映了在線評論的感知有用性,但是不能直接用來衡量評論的有用性。因為評論發布的時間會影響有用性投票數的絕對量,而且有用投票數是一個長期投票的累積量,不能用來衡量評論在短期的有用性[7]。所以,采用兩個階段的有用投票數的差值,即有用投票數在同一段時間內的增量作為因變量。
3.2.2 自變量
解釋變量包含評論內容特征和評論者特征兩個部分。評論長度表示評論文本的字數。評論極端性用消費者星級評分來測度,為檢驗H1b中評論極端性的影響,我們設置了評分和評分的平方項。有用性投票是指我們第一次抓取數據時,每條評論得到的有用性投票數。評論認可度是指評論者所有評論得到的有用性投票數之和占該評論者總評論數的比,它表示評論者發表評論被消費者認可有用性的大小。評論者個人信息披露是指評論者是否將自己的年齡或者性別公開,它是個虛擬變量,評論者披露了個人的年齡或性別的賦值為1,反之賦值為0。通過數據清洗,得到了204家酒店4 258條有效評論。
3.2.3 控制變量
在實際中,評論的發布時間會對評論有用性投票產生影響,進而影響評論的有用性。評論發布的時間越早,得到的絕對有用投票數越多,而有用投票數的增量越少。因此我們將評論的暴露時間作為控制變量。
3.3 分析方法
本文運用負二項回歸對模型進行估計。負二項分布是統計學上的離散概率分布,它表示一個事件在伯努利試驗中出現的概率為P,在一系列獨立的伯努利試驗中,事件剛好在第r+k次出現r次的概率為

x=r,r+1,…,其中r為一個固定的整數。
負二項回歸適合用來擬合離散的計數數據,要求數據的方差大于條件均值。通過比較負二項分布和樣本數據分布特征,運用負二項回歸比較理想,尤其當觀測數據中具有較多的0時,用負二項回歸來擬合模型更加合適。一方面,運用負二項回歸是由數據特征決定的,有用性投票數是消費者感知有用性投票的累計結果,是一個計數數據。其次,因變量包含了大量的0值(見表1),負二項分布能夠修正0值的影響效果。此外,盡管我們基于大數據選擇了一個大樣本,潛在的選擇性偏誤仍然可能存在[2]。因為TripAdvisor.com沒有顯示有多少人瀏覽過該評論,它僅提供了得到有用性投票的那部分數據,運用OLS估計就會存在較大偏誤。具體的回歸模型如下:
Helpfulness(ΔHelpfulVotes)=β1ConsumerRating+β2ConsumerRating2+β3ReviewLength+β4HelpfulVotes+β5InformationDisclosrue+β6PeerRecognition+β7ExposureTime+ε
4.1 描述性統計分析
變量描述性統計分析結果顯示(表1),絕大多數有用性投票數增量(因變量)為0,平均增加的有用性投票數也接近0,但最高也可以達到6。有用性投票數均值不到1,而最大值為11,說明很多評論沒有得到有用性投票,有些評論得到了較多有用性投票,表明大多數消費者并不熱衷于對在線評論的有用性投票,只有當評論對其特別有價值的情況下才會投有用票。消費者評分的均值、第一四分位數和中位數都在4附近,表明大部分消費者傾向于給高分。平均評論長度為152,最大值可達到3 425個字數。評論者信息披露的均值為0.68,表明披露個人信息的評論者和沒有披露個人信息的評論者各占68%和32%,更多的人樂意將自己的個人信息公開。評論者發表評論的認可度最小為0,均值為0.67,說明大部分評論者發表的評論得到消費者認可的較小,有的評論者根本沒有被消費者認可,最大值為18.34,表明有的評論者發表的評論得到大多數人的認可,并給予了很高的評價。
表1 變量描述性統計分析結果

變 量最小值均 值最大值因變量00.086消費者評分1.004.025.00評論長度261523425有用性投票數00.6311個人信息披露00.681評論認可度0.000.6718.34暴露時間1188274
4.2 回歸分析
回歸分析結果表明(表2),模型中的參數都具有較高的顯著性水平。模型的擬合優度R2為0.467,調整R2為0.482,與同類研究相比,模型的擬合結果較好,表明模型能夠在很大程度解釋在線評論有用性影響因素。

表2 回歸分析結果
注:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1 ‘’1
4.3 結果分析
從表2中發現,評論長度具有較高的顯著性水平(p=0.0029),證明評論長度是影響在線評論有用性的重要因素。其參數為正(β3=0.0007),說明評論長度對在線評論有用性具有正向影響。消費者評分和消費者評分的平方項都通過了顯著性檢驗,且具有較高的顯著性水平。消費者評分的平方項系數為正(β2=0.234),說明該影響是一個“U”形關系,表明極端好評和極端差評比中性評論的影響作用更大,充分證明了原假設。評論有用性投票數也通過了顯著性檢驗(P=1.19E-05),其參數為正(β4=0.172),表明評論已經獲得的有用性投票數對后續消費者的有用性投票會產生影響,該評論持續獲得有用性投票數越多,后續感知有用性也會相應提高。評論者個人信息披露估計參數為正(β5=0.002),說明個人信息披露會對評論有用性產生正向影響。評論者的評論認可度具有較高的顯著性水平(P=0.007),該參數為正(β6=0.108),對在線評論有用性具有較大的正影響。
評論暴露時間也具有較高的顯著性水平,其參數為負(β7=-0.015),說明評論暴露的時間對有用性也會產生影響,評論暴露的時間越長,其后續獲得有用性投票會越少,隨著時間的推移,評論有用性呈現出衰減的狀態。研究假設檢驗結果見表3。

表3 假設檢驗結果
5.1 研究結論
本研究在大數據的背景下展開,通過構建多元回歸模型進行實證分析,發現在線評論內容和評論者的特征是在線評論有用性的根本影響因素,最終得到以下結論:
5.1.1 評論內容本身特征影響在線評論有用性
評論長度與評論有用性正相關,評論長度越長,消費者對評論的感知有用性就越高;評論極端性與在線評論有用性顯著正相關,極端好評或極端差評比中性評論更有用;評論的有用性投票數對評論有用性具有顯著正影響,消費者對評論的感知有用性受到評論已經獲得的有用性投票數影響,消費者對有用性投票數較多的評論認可度較高。
5.1.2 評論者的特征是在線評論有用性的重要影響因素
評論者認可度與評論有用性正相關,其發表的評論被同類消費者感知有用性程度越高,該評論者的評論更有用;評論者個人信息披露與評論有用性相關正相關,有個人信息披露的消費者評論有用性更高。
5.2 啟示和建議
首先,在線零售商應該合理設置在線評論系統,引導消費者撰寫有價值的評論[17,21]。在線評論系統可以用來提升消費者購物經驗和增強公司的盈利能力。有用評論將幫助企業和零售商增加銷售和提升品牌形象。由于評論長度對在線評論有用性具有正面影響,企業和零售商應該完善在線評論系統,讓消費者的評論更加詳細。其次,在線零售商應該鼓勵消費者對其認可的評論進行投票,有用性投票數通常是消費者衡量評論有用的直接指標,有用性投票數將會影響消費者對評論的感知有用性,也對后續消費者閱讀評論產生影響。第三,在線零售商不必對負面評論產生恐懼,極端評論,包括極端好評和極端差評,都被消費者認為具有較高的有用性。負面評論的存在讓消費者會更加相信在線評論的真實性和客觀性。
對于消費者而言,在識別有用評論作為購物決策參考時,不僅要關注評論內容本身,還應當參考評論發表者的特征。消費者應該選擇那些較長的和消費者認可度較高的評論者發表的評論作為參考,盡量不要參考那些中性評論,極端評論比中性評論價值更高。其次,評論者的個人信息披露情況也是篩選有用性高的評論的參考標準,個人信息披露越完善的評論者發表的評論更可信。通過篩選有用的評論,能夠提高購物決策效率,減少搜索成本,增強消費信心。
5.3 研究局限和未來展望
在研究過程中,對構建模型、理論支撐選擇、數據收集和模型估計都進行了嚴格控制,但是仍然存在一定局限性。首先,解釋變量僅考慮了評論的數字指標,沒有考慮評論文本的影響,有研究表明文本可讀性和主觀性對在線評論有用性具有重要影響[15,18]。因此,未來的研究可以將數據挖掘和文本挖掘的方法相結合。其次,研究結論基于消費者對評論的有用性投票得到,沒有測度那些沒有進行有用性投票和認為評論不具有有用性的在線評論。
[1]Chevalier J A,Mayzlin D.The effect of word of mouth on sales:Online book reviews[J].Journal of Marketing Research,2006,43(3):345-354.
[2]Mudambi S M,Schuff D.What makes a helpful online review?A study of customer reviews on Amazon.com[J].MIS quarterly,2010,34(1):185-200.
[3]Ghose A,Ipeirotis P G.Estimating the socio-economic impact of product reviews:Mining text and reviewer characteristics[J].NYU Stern Research Working Paper CeDER,2008,18(7):48-56.
[4]Willemsen L M,Neijens P C,Bronner F.“Highly Recommended!”The content characteristics and perceived usefulness of online consumer reviews[J].Journal of Computer-Mediated Communication,2011,17(1):19-38.
[5]劉送英.在線顧客評論有用性研究[D].泉州:華僑大學,2011.
[6]郝媛媛,葉強.基于影評數據的在線評論有用性影響因素研究[J].管理科學學報,2010,19(8):78-88.
[7]Archak N,Ghose A,Ipeirotis PG.Deriving the pricing power of product features by mining consumer reviews[J].Management Science,2011,57(8):485-509.
[8]Forman C,Ghose A,Wiesenfeld B.Examining the relationship between reviews and sales: The role of reviewer identity disclosure in electronic markets[J].Information Systems Research,2008,19(3):291-313.
[9]Pan Y,Zhang J Q.Born Unequal:A Study of the Helpfulness of User-Generated Product Reviews[J].Journal of Retailing,2011,87(4):598-612.
[10]Korfiatis N,García-Bariocanal E,Sánchez-Alonso S.Evaluating content quality and helpfulness of online product reviews:The interplay of review helpfulness vs.review content[J].Electronic Commerce Research and Applications,2012,11(3):205-217.
[11]彭嵐,周啟海,邱江濤.消費者在線評論有用性影響因素模型研究[J].計算機科學,2011,32(8):205-207.
[12]殷國鵬,祝珊.網絡社區在線評論有用性影響模型研究——基于信息采納與社會網絡視角[J].圖書情報工作,2012,(16):140-147.
[13]殷國鵬.消費者認為怎樣的在線評論更有用?——社會性因素的影響效應[J].管理世界,2012,(12):115-124.
[14]Sussman S W,Siegal W S.Informational influence in organizations:an integrated approach to knowledge adoption[J].Information Systems Research,2003,14(1):47-65.
[15]Ngo-Ye T L,Sinha A P.Analyzing Online Review Helpfulness Using a Regressional ReliefF-Enhanced Text Mining Method[J].ACM Transactions on Management Information Systems,2012,3(2):1-20.
[16]Poston R S,Speier C.Effective use of knowledge management systems:a process model of content ratings and credibility indicators[J].MIS quarterly,2005,29(2):221-244.
[17]郭林方.影響在線評論有用性的相關因素研究[D].大連:東北財經大學,2012.
[18]Ghose A,Ipeirotis P G.The EconoMining project at NYU:Studying the economic value of user-generated content on the internet[J].Journal of Revenue & Pricing Management,2008,37(16):241-246.
[19]Walther J B,Liang Y J,Ganster T.Online reviews,helpfulness ratings,and consumer attitudes:An extension of congruity theory to multiple sources in Web2.0[J].Journal of Computer Mediated Communication,2012,18(1):97-112.
[20]Klionsky D J,Abdalla F C,Abraham R T,et al.Guidelines for the use and interpretation of assays for monitoring autophagy[J].Autophagy,2012,8(4):445-544.
[21]Zhu F,Zhang X.Impact of online consumer reviews on sales:The moderating role of product and consumer characteristics[J].Journal of Marketing,2010,74(2):133-148.
(本文責任編輯:孫國雷)
Empirical Study of Online Consumer Review Helpfulness Determinants——Based On Hotel Review Data of Tripadvisor.com
Zhuo Siqing Feng Yongzhou*
(School of Economics and Management,Wuhan University,Wuhan 430072,China)
With rapid development of the Internet,consumers have increasingly relied on online reviews prior to making purchase decisions.This paper discussed the determinants of helpfulness of online consumer reviews from the perspective of information adoption model.By designing time window of helpful votes and building concept model of review helpfulness,the paper mainly discussed the influence of review content and reviewers’ characteristics on review helpfulness.Based on 4258 hotel review data of Tripadvisor.com,the paper did empirical analysis by using negative binomial regression.The results found that review length,rating extremity,number of helpful votes,peer recognition and information disclosure have significantly positive influence on review helpfulness.The conclusions would give some important implications and suggestions for both online retailers and consumers.
online reviews;review helpfulness;negative binomial regression;big data
2014-12-04
卓四清(1965-),男,副教授,研究方向:管理科學與工程和數據挖掘。
馮永洲(1989-),男,碩士研究生,研究方向:管理科學與工程和數據挖掘。
10.3969/j.issn.1008-0821.2015.04.011
F724.6
A
1008-0821(2015)04-0052-05