呂心怡

摘要:文章通過建立評論有用性指標體系,評級指標體系模型,以及回歸模型對數據進行分析,建立一種在大數據分析下評價客戶對產品評論質量的評級體系。商家通過建立的評價體系,能從客戶的評論中得到有幫助的信息,以便更好的在網絡市場上銷售產品。
Abstract: The article analyzes the data by establishing a review usefulness index system, a rating index system model, and a regression model, and establishes a rating system that evaluates the quality of customer reviews of products under big data analysis. Through the established evaluation system, merchants can get helpful information from customer reviews in order to better sell products in the online market.
關鍵詞:在線評論;有用性;指標體系
Key words: online reviews;usefulness;index system
中圖分類號:F724.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)21-0215-02
0? 引言
在創建在線市場以來,網上購物越來越普遍。網絡口碑平臺為客戶提供了對產品進行評分和評價的機會。因此,商家可以根據客戶對產品評價所得到的數據,深入了解其參與的市場,參與的時間以及產品設計功能選擇的潛在成功,制定產品的銷售策略,以便能更好的把握網絡市場的需求。
本文通過建立評級指標體系模型和評論指標體系模型,可以在產品出售后得知產品的優缺點。對于評論與星級之間的關系和評論特定質量描述符與評論水平之間的關系,建立回歸模型,從中了解它們之間的聯系。
1? 理論模型
對于評價的度量,本文主要通過星級來評判。通過對星級的分析,可以利用滿意星級指標來度量評價標準。通過客戶對產品的評定的星級數據,可以知道客戶對產品的滿意程度,其中,星級越高,說明產品越受客戶歡迎。
對于評論的度量,根據Liu等所作的工作,發現產品設計師更青睞包含更多有用信息的評論[1]。因此,提取影響評論的特征指標,建立評論有用性指標體系。
1.1 評論的語言特征
對于評論的語言特征,本文通過對評論文本的分析了解到:產品的優缺點包含在評論的字數N,句子數L,平均句子長度L′中。同時客戶會將自己對產品的喜愛程度用形容詞數ADJ.和副詞數ADV.來描述。
1.2 評論的元數據特征
在線評論中,元數據包括有用的投票數和評論有用度?茁。
1.3 評論人的特征
根據相關文獻[2],評論人的等級對評論有用性有正向的影響。對于評論人的特征,本文使用評論人等級描述評論人的特征。評論人的等級是基于客戶是否為Amazon Vine Voices,即Amazon邀請那些在Amazon社區中撰寫準確而有見地的評論的客戶。一般來說,能夠成為Amazon Vine Voices意味著客戶對產品的評論是比較準確、有見地。
2? 數據處理
2.1 數據預處理
數據來源于陽光公司的三種產品在亞馬遜平臺上的顧客評論信息。在建立模型前,需要數據預處理。在數據集中發現沒有購買產品的客戶也對產品做出了評論,這些評論顯然不能作為研究的數據。因此,將沒有購買產品卻對產品做出評論的客戶信息進行剔除,剩下的評論都是購買了產品的客戶。
2.2 評論的度量參數
2.2.1 評論有用度
由于有用的投票數據和總共的投票數據不一致,得出初步結論:對于一條評論,并不是對所有客戶有用。通過查閱文獻,可以得到有用的投票數或有用的投票數占總投票數的比例作為衡量指標[3][4]。因此,建立評論有用度?茁,即有用的投票數H與總共的投票數V的比值。
根據張鎮平等人所作的工作[5],得知:評論的質量與評論的字數、句子數、平均句子數、形容詞和副詞數,以及評論的主觀和客觀的句子數、產品數等有關。因此,可以根據這些變量將評論的文本量化處理,得到評論質量的度量指標。
2.2.2 評論的字數和句子數
利用EXCEL篩選功能篩選出每條評論的字數和句子數,通過計算得到客戶對三種產品評論的總字數和平均字數,總句子數和平均句子數。
2.2.3 評論的平均句子長度
根據相關文獻[6],句子平均長度可以作為衡量評論可讀性的指標,評論的平均句子越長,可讀性越低。因此,為了更加客觀的描述,本文將評論的字數和句子數進行綜合,定義了一個新的變量:平均句子長度L′,即評論的字數N與評論的句子數L的比值。
2.2.4 評論的形容詞數和副詞數
根據相關文獻可從情感詞、程度詞、否定詞、標點符號、修辭等方面來分析句子的情感和特征[7]。因此,本文使用形容詞和副詞表達評論中句子的特有情感。
2.2.5 滿意星級
因為客戶在購買產品后,會根據自己的看法來評定產品的星級,以此來表現自己對產品的滿意度。星級越高說明客戶對產品越滿意,相應的評論也就將會出現滿意的詞。因此,從星級評定的角度來分析客戶的評論質量。
3? 數據分析與結果
3.1 描述性統計
利用MATLAB編程軟件求解數據,得到吹風機有用性指標的描述性統計結果如表1。微波爐和奶嘴的有用性指標的描述性統計結果可按同理進行計算。
3.2 參數估計與分析
為了確定參數的可靠性,可以把參數數據帶入模型中,對吹風機進行參數估計,結果如表2。微波爐和奶嘴的參數估計分析可按同理進行分析。
根據吹風機參數估計的結果,得到:吹風機各參數的樣本均值近似等于總體均值,樣本標準差近似等于總體標準差。這個結果說明樣本均值和標準差是總體均值、標準差的一致無偏估計。
4? 總結
本文建立評級指標體系模型和評論指標體系模型。對于評級指標體系模型,得到星級評分和評論的正能量性作為評級度量標準。對于評論有用性指標體系模型,得到了評論有用性指標體系和體系的模式圖,以此作為評論的評價度量標準。
為了確定最能表明潛在成功的基于文本的度量和基于評級的度量的組合,建立回歸模型表示它們之間的在組合關系。
參考文獻:
[1]Liu, Y., et al. Identifying helpful online reviews: A product designe's perspective[J]. Computer-Aided Design, 2013, 45(2): 180-194.
[2]廖成林,蔡春江,李憶.電子商務中在線評論有用性影響因素實證研究[J].軟科學,2013,27(05):46-50.
[3]Kim, S. M., et al. (2006). Automatically assessing review helpfulness. Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing.
[4]Korfiatis, N., et al. (2008). The Impact of Readability on the Helpfulness of Online Product Reviews: A Case Study on an Online Bookstore, Springer Berlin Heidelberg.
[5]張鎮平.基于商家維度的在線評論研究[D].北京郵電大學,2016.
[6]殷國鵬.消費者認為怎樣的在線評論更有用?——社會性因素的影響效應[J].管理世界,2012(12):115-124.
[7]史偉,王洪偉,何紹義.基于語義的中文在線評論情感分析[J].情報學報,2013,32(08):860-867.