999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線評論投票數的影響因素研究

2012-12-31 00:00:00高雅李紅施慧斌
中國管理信息化 2012年17期

[摘 要] 在線評論的投票數反映了閱讀者對該條評論的關注度,對潛在消費者的購物決策具有很大的參考價值。本文以京東商城熱門手機的在線評論為研究對象,結合文本挖掘技術和實證研究方法,從數字特征、寫作風格和語義3個維度研究在線評論投票數的影響因素。研究表明:評論中優點和不足內容是否相同對投票數有顯著的正向影響,評論正文的主觀性對投票數有顯著的負向影響。此外,產品故障詞、產品特征詞和情感程度詞對投票數也有重要影響。

[關鍵詞] 電子商務; 在線評論; 投票數; 文本挖掘; 語義

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 17. 050

[中圖分類號] F713.36 [文獻標識碼] A [文章編號] 1673 - 0194(2012)17- 0088- 04

1 引 言

在線評論被認為是傳統口碑的數字化表現形式[1],承載了消費者的直接產品體驗,蘊含了大量的管理和決策支持信息。其價值可以從買方和賣方兩方面來分析:

(1) 買方價值:在線評論屬于一種無偏產品信息,其可信度大大高于商家的促銷信息,對潛在客戶的購買決策具有重要影響[2]。

(2) 賣方價值:廠商可以通過對用戶發表的在線評論的研究,來發現用戶對本企業產品的滿意程度,本產品與同類產品相比的優勢和劣勢,據此對產品進行改進,從而增強企業競爭力。

然而,隨著在線評論的不斷增加,在線評論也出現了信息爆炸時代的普遍問題——信息過載[3-4]。在線評論數量的巨大和質量的參差不齊嚴重干擾了評論閱讀者對產品質量的有效判斷,增加了信息搜尋成本,降低了決策的效率[5]。因此,有效地識別在線評論的價值就顯得至關重要。

許多電子商務網站會鼓勵閱讀者對自己看到的在線評論進行投票,然后利用投票數來評價一條評論的有用性。本文在現有研究的基礎上,構建在線評論投票數的影響因素模型。本文的研究目的是更好地解釋為什么有的評論會得到較多的投票數,而有的評論只得到很少的投票數。

本文收集了中國最大的電子產品交易網站——京東商城熱門手機的在線評論信息,結合文本挖掘技術和實證研究方法,從數字特征、寫作風格和語義3個維度來研究在線評論投票數的影響因素、作用方向和重要程度。本文內容組織如下:第2節,根據相關理論和文獻研究提出理論假設,建立在線評論投票數的影響因素模型。第3節,闡述數據采集、處理和實證分析的過程,并對分析結果進行分析和解釋。第4節,給出研究結論及其意義,并指出研究局限和后續研究方向。

2 模型與理論假設

在之前研究的基礎上,本文構建的在線評論投票數影響因素模型如圖1所示。

2.1 數字特征維度

數字特征指的是不涉及文本內容的信息,包括:① 產品的平均得分,記為AvgScore。② 評論者評分,記為Rating。③ 評論發表距今的時間間隔,記為ElapsedDay。④ 評論者是否填寫了產品的不足,記為NoDisadv。

文獻[6]研究表明評論者是否填寫了產品的不足對投票數沒有顯著影響,這與之前的研究略有出入。消費者通常會認為負面信息比正面信息更具診斷價值,因而在做購買決策時更多地依賴負面信息[5] ,而產品的不足反映的正是其負面信息,由此,本文提出假設H1。

H1:評論者是否填寫了產品的不足對投票數有顯著的正向影響。

2.2 寫作風格維度

寫作風格反映了評論人寫作的特點。寫作風格主要體現在正文各部分內容(優點、不足和使用心得)是否相同,文本長度,平均句長和評論的主觀性等方面。

評論可以分為標題和正文。標題通常比較短,評論者的寫作風格主要體現在正文里,所以本文中寫作風格主要指的是正文風格。寫作風格包括:① 正文各部分內容(優點、不足和使用心得)是否相同,記為Same。② 文本長度。評論分為標題和正文兩部分,標題長度記為TitLen,正文長度記為ConLen。本文將長度作為文本信息量的一個度量指標。③ 平均句長,記為AvgLen。④ 評論的主觀性,記為Sub。本文把評論中形容詞所占比重作為評論主觀性的代理指標。

正文各部分內容(即優點、不足和使用心得)是否相同以及評論的主觀性是本文新加入模型的影響因素。

評論者在優點、不足和使用心得中填寫相同的內容,可能的原因是:用重復來強調自己滿意或者不滿意的強烈情感;發表評論僅為了獲得網站的積分,復制粘貼可以節約時間。基于以上的分析,并不能斷定正文各部分內容是否相同對投票數的影響是正向還是負向。正文分為優點、不足和使用心得3部分,通常來講,優點是對產品的正面評價,不足是對產品的負面評價,使用心得是對產品的總體評價,表達正面情感或者負面情感均可。若優點和不足填寫了相同的內容,評論者可能是想通過這種重復來強調自己的某種情感(滿意或者不滿意),那么它對投票數有正向影響;若使用心得和優點或者是不足內容相同,這樣就會減少評論的信息量,可能會對投票數有負向影響。由此,本文提出假設H2。

H2:正文各部分內容是否相同對投票數有影響,但不確定是正向還是負向。

H2a:評論優點和不足內容是否相同對投票數有顯著的正向影響。

H2b:評論優點和使用心得內容是否相同對投票數有顯著的負向影響。

H2c:評論不足和使用心得內容是否相同對投票數有顯著的負向影響。

文獻[7]把評論文本內容分為客觀和主觀兩類。文獻[8]研究了文本的主觀性對在線評論有用性的影響,結果發現,評論的主觀性越大,評論的有用性越低。由此,本文提出假設H3。

H3:評論的主觀性對評論的投票數有顯著的負向影響。

2.3 語義維度

文獻[6]研究表明語義是影響投票數的重要因素,但是并沒有深入研究每一個詞語對投票數的影響,且由于采用了因子分析的方法,實驗結果比較難以解釋。挖掘重要產品特征和判斷評論觀點的情感傾向是在線評論挖掘的兩個很重要的方面[9],所以本文假設產品特征和觀點的強烈程度對投票數有顯著影響。文獻[5,10]都直接把評論者評分作為評論者情感傾向的代理指標,并未從語義的角度來考慮情感傾向及其程度,所以本文將通過情感程度詞來展現評論者情感強烈程度。本文擴展了原模型中語義對投票數的影響,從產品特征詞(記為Feature)、產品故障詞(記為Breakdown)和情感程度詞(記為SenDe) 3方面來研究語義對投票數的影響。

評論中體現的產品特征越多,評論就可能得到越多的投票數;評論者的情感越強烈,評論就可能得到越多的投票數。由此,本文提出假設H4、H5、H6。

H4:產品特征詞對評論的投票數有顯著的正向影響。

H5:產品故障詞對評論的投票數有顯著的正向影響。

H6:情感程度詞對評論的投票數有顯著的正向影響。

2.4 回歸方程模型

根據以上假設,建立在線評論投票數影響因素模型,見公式(1)。

Votes = α + β1 × AvgScore + β2 × Rating + β3 × ElapsedDay + β4 × NoDisadv + β5 × Same + β6 × RitLen + β7 × ConLen + β8 × AvgLen + β9 × Sub + β10 × Feature + β11 × Breakdown + β12 × SenDe + ε (1)

在公式(1)中,α是常量,ε是隨機變量,即沒有被模型解釋的信息。需要說明的是,公式中的β5,β10,β11,β12 以及Same,Feature,Breakdown和SenDe都是向量,而不是單個的變量。Same = (Same 1,Same 2,Same 3),是三元變量,Same 1指的是優點和不足內容是否相同,Same 2指的是優點和使用心得內容是否相同,Same 3指的是不足和使用心得內容是否相同。Feature,Breakdown和SenDe則要根據具體操作過程中選定的產品特征詞、產品故障詞和情感程度詞的個數而定。

3 實證研究

3.1 數據采集

本文的實驗數據來源于京東商城(www.360buy.com)。京東商城是中國最大的電子類產品交易網站,網站上匯集了大量的在線評論。本文抓取了京東商城上熱門的31款手機的評論數據,涵蓋了諾基亞、蘋果、摩托羅拉、三星、金立等眾多的國內外品牌。

在對2 127條評論的投票數中,最多的是147票,最少的是0票,隨著投票數的增多,評論數量在減少,尤其是當投票數超過15時,評論數量急劇減少,所以本文將投票數大于等于15票的評論歸并為一組,投票數統一記作15。表1展示了評論投票數的分布情況。

按照京東商城的規定,在線評論的評分、標題、優點、不足和使用心得都是必填項,不過產品缺點排在了最后一行,且設置有默認值“暫時還沒有發現缺點哦!”。本文認為若在線評論的缺點采用了京東商城的默認值,則可以認定為評論人沒有填寫產品的不足,用0表示;若評論者填寫了產品的不足,則用1表示。

3.2 數據處理過程

數據處理過程如圖2所示:① 評論篩選,剔除質量較差的評論,如標題中只有符號沒有文字的評論。② 數據預處理,可以直接獲得一些變量的值。③ 構建自定義詞庫。在線手機評論中包含一些手機專有詞匯和一些不太規范的網絡用語,而這些詞語是不包含在分詞軟件的自有詞庫中的(如性價比,花屏,坑爹,給力等),所以需要將這些詞加入自定義詞庫中。此外,由于后面研究語義特征對投票數影響時考慮了情感程度詞,所以需要將情感程度詞也加入自定義詞庫中。本文采取人工定義的方法,從手機參數和產品評論中選取了111個手機特征詞,46個手機故障詞和10個網絡常用詞。情感程度詞采用的是中國知網發布的知網情感詞匯(beta版)中程度級別詞語(中文)所列出的216個程度詞。④ 分詞并標注詞性。本文采用中國科學院計算機所軟件室編寫的中文分詞工具ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)對評論文本語料進行分詞。

3.3 實驗過程及其結果分析

本文采用線性回歸中的逐步回歸法來研究在線評論投票的影響因素。逐步回歸法是一種常用的消除多重共線性、選取“最優”回歸方程的方法。本文提出的眾多變量之間可能存在共線性,運用逐步回歸法可以有效地消除共線性,選出影響投票數的關鍵因素,所以本文的實驗方法選用逐步回歸法。

本文提出模型的整體擬合度以及標準化參數估計結果見表2。為檢驗本文模型的擬合效果是否有所提高,采用本文使用的評論數據對文獻[6]提出的模型進行擬合,對照比較兩者的估計結果(說明:因為語義維度包含較多的詞語,所以表2中未列出其回歸系數)。

對于本文提出的假設模型,F檢驗顯著,表明模型線性回歸關系成立,總體擬合指標——調整R2為0.365,而利用本文的手機評論數據擬合文獻[6]中的模型,其調整R2為0.322。在加入本文新提出的幾個因素之后,模型的總體擬合度從0.322提高到了0.365,提高了13.35%,效果顯著,說明本文模型對在線評論投票數的總體解釋力明顯好于文獻[6]的研究模型。本文模型的回歸結果對前述假設的支持情況見表3。

從本文模型的回歸結果中,可以得出以下結論:

(1) 對評論投票數影響最大的是平均得分和評論者評分,且回歸系數都為負。若一個手機的平均得分較低,那么針對它的評論就可能得到更多的投票數,若一條評論的評論者評分較低,則該條評論就可能得到更多的投票。這與之前文獻的結論一致:消費者通常會認為負面信息比正面信息更具診斷價值,因而在購買決策時更多地依賴負面信息[5] 。

(2) 優點和不足內容是否相同對評論投票數有正向影響。若評論中的優點和不足內容相同,則該條評論就可能得到更多的投票數。可能的解釋是:通常意義上,優點應該是評論者對產品的贊美,包含正向情感,不足應該是評論者對產品的不滿,包含負向情感。若優點和不足內容相同,很可能評論者是想通過這種重復的方式來表達自己某種強烈的情感。

(3) 正文中形容詞比例對投票數有負向影響,即評論正文中形容詞比例越低,則該條評論就可能得到更多的投票數。對于電子類產品,比較客觀的評論容易吸引閱讀者的投票。

(4) 手機故障詞對投票數有正向影響。可能的解釋是:如果評論正文中出現了這些手機故障詞,通常都表達了評論者對手機的負向情感,較易吸引閱讀者的投票。對投票數有顯著影響的手機故障詞有:退貨,換貨,假貨,掉漆,黑屏,自動關機,二手貨,劃痕,花屏,高仿。

(5) 手機特征詞和情感程度詞對投票數的影響不定,有些詞是正向影響,有些詞是負向影響。可能的解釋是:單獨的手機特征詞和情感程度詞本身并不能表示出有用的信息,需要結合其前后的詞語和所在的語境做更加深入的分析才能對其進行評價。對投票數有顯著影響的手機特征詞有:客服,手機,東西,機器,服務,信號,數據線,軟件,音質,功能,按鍵,機子,商品,屏幕,后蓋,價格,物流,機型,觸屏,質保。對投票數有顯著影響的情感程度詞有:很,挺,極端,一點兒,這樣,極其,不過,最。

(6) 正文長度和標題長度對投票數有正向影響,即標題越長,正文長度(優點、不足和使用心得的總長度)越長,則該條評論就可能得到越多的投票。可能的解釋是:文本的長度從某種程度上反映了文本包含的信息量,閱讀者瀏覽評論時傾向于信息量大的評論,這是容易理解的。

(7) 評論發表距今的時間對投票數有正向影響,即評論發表越早,該條評論就可能得到更多的投票數。

4 結束語

本文以京東商城上熱門手機的在線評論為研究對象,結合文本挖掘技術和實證研究方法,從數字特征、寫作風格和語義3個維度來研究眾多的變量對在線評論投票數的影響。研究表明:產品的平均得分,評論者評分,正文長度,評論發表時間,優點和不足內容是否相同,標題長度,手機故障詞等變量對評論投票數有較大影響。

較之于以前的研究,本文的主要貢獻在于:① 研究了正文各部分內容是否相同對投票數的影響。研究結果表明優點和不足的內容相同對于投票數有較大影響,其重要程度甚至超過了評論標題長度對投票數的影響。② 研究了評論的主觀性對投票數的影響。研究結果表明:評論的主觀性對投票數有較大的負向影響。③ 研究了產品特征詞、產品故障詞和情感程度詞對投票數的影響。本文的研究結論對于購物網站和評論者發表評論都具有現實的參考價值。

本文尚有一些不足有待改進:本文選取了京東商城的熱門手機評論數據進行研究,文中結論對于其他類產品是否適用有待進一步的檢驗,這將是筆者未來研究的主要方向。

主要參考文獻

[1] C Dellarocas. The Digitization of Word of Mouth: Promise and Challenges of Online Feedback Mechanisms[J]. Management Science,2003,49(10) :1407-1424.

[2] 金立印. 網絡口碑信息對消費者購買決策的影響:一個實驗研究[J]. 經濟管理, 2007,29(22):36-42.

[3] E Brynjolfsson,M D Smith. Frictionless Commerce?A Comparison of Internet and Conventional Retailers[J]. Management Science,2000,46(4):563-585.

[4] Q Jones,G Ravid,S Rafaeli. Information Overload and the Message Dynamics of Online Interaction Spaces:A Theoretical Model and Empirical Exploration[J]. Information Systems Research,2004,15(2):194-210.

[5] 郝媛媛, 葉強, 李一軍. 基于影評數據的在線評論有用性影響因素研究[J]. 管理科學學報,2010,13(8).

[6] Qing Cao, Wenjing Duan, Qiwei Gan. Exploring Determinants of Voting for the “Helpfulness” of Online User Reviews: A Text Mining Approach[J]. Decision Support Systems,2011,50(2):511-521.

[7] Pang B, Lee L. A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts [C]. Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL), Morristown, NJ, USA: Association for Computational Linguistics, 2004.

[8] Ghose A,Ipeirotis P G. Designing Novel Review Ranking Systems: Predicting the Usefulness and Impact of Reviews[C]. Proceedings of the 9th International Conference on Electronic Commerce,New York,NY,USA: Association Computing Machinery(ACM),2007:303-310.

[9] Anna-Maria Popescu,O Etzioni. Extracting Product Features and 0pinions from Reviews[C]. Proceedings 0f HIJ-EMNLP 2005,ACL,2005:339-346.

[10] M P O’Mahony,B Smyth. A Classification-Based Review Recommender[J]. Knowledge-Based Systems,2010,23(4):323-329.

主站蜘蛛池模板: 97av视频在线观看| 久久精品人人做人人爽97| 国产精品自在自线免费观看| 国产午夜小视频| 男人天堂伊人网| 一级毛片在线免费视频| 日韩视频精品在线| 久久亚洲中文字幕精品一区 | 国产成人无码Av在线播放无广告| 国产亚洲精久久久久久久91| 91精品福利自产拍在线观看| 爽爽影院十八禁在线观看| 国产精品99久久久久久董美香| 中文字幕在线看视频一区二区三区| 婷婷色在线视频| 国产精品成人观看视频国产 | 97国产一区二区精品久久呦| 亚洲人成人伊人成综合网无码| 五月婷婷伊人网| 亚洲AV成人一区二区三区AV| 亚洲欧洲综合| 色噜噜狠狠狠综合曰曰曰| 国产精品美女网站| 亚洲精品自拍区在线观看| 国产精品成人免费综合| 成人福利视频网| 中文字幕有乳无码| 激情成人综合网| 色香蕉网站| 日韩黄色精品| 久久精品亚洲专区| 91久久精品国产| 国产激情无码一区二区APP| 一区二区欧美日韩高清免费| 欧美综合区自拍亚洲综合绿色| 综合久久久久久久综合网| 欧美激情,国产精品| 国产欧美日韩va| 在线日韩一区二区| 国产精品99久久久久久董美香| 欧洲亚洲一区| 免费A∨中文乱码专区| 试看120秒男女啪啪免费| 国产91丝袜在线播放动漫| 亚洲熟女中文字幕男人总站| 欧美成人精品欧美一级乱黄| 欧美国产另类| 手机看片1024久久精品你懂的| 亚洲二三区| 免费在线不卡视频| 重口调教一区二区视频| 久久久久久国产精品mv| 欧美a级完整在线观看| 国产最新无码专区在线| 亚洲视频免费播放| 韩日无码在线不卡| 亚洲AV无码久久天堂| 国产理论精品| 一级成人a毛片免费播放| 人妻丰满熟妇AV无码区| 人妻丝袜无码视频| 亚洲区第一页| 免费在线看黄网址| 中文字幕有乳无码| 久久一级电影| 国产伦精品一区二区三区视频优播| 丰满的熟女一区二区三区l| 午夜人性色福利无码视频在线观看| 一级毛片a女人刺激视频免费| 波多野结衣无码视频在线观看| 全色黄大色大片免费久久老太| 国产午夜福利在线小视频| 毛片免费高清免费| 亚洲综合色吧| 夜夜操天天摸| 亚洲无码91视频| 亚洲一级毛片| 亚洲精品福利网站| 美女一级毛片无遮挡内谢| 五月婷婷丁香综合| 国产美女一级毛片| 国产精品夜夜嗨视频免费视频 |