顏紫欣 游凡毅 齊奕萌 首都經(jīng)濟貿(mào)易大學(xué)管理工程學(xué)院
在當(dāng)今的網(wǎng)絡(luò)信息時代,電子商務(wù)因其開放性、全球性、低成本和高效率的特點得以發(fā)展,現(xiàn)今已然成為人們生活中不可或缺的成分。從消費者的反饋中提取有效信息,并根據(jù)信息調(diào)整銷售模式以獲得更多利益是商家發(fā)展不可缺少的一步,消費者的反饋在不同電子商務(wù)平臺有著不同的表現(xiàn)形式,通常為評星(一共有五顆星,從最差到最好分別是一星到五星,消費者可根據(jù)使用感受決定星星的數(shù)量)和文本評論。
首先將數(shù)據(jù)進行預(yù)處理,刪除重復(fù)等無用數(shù)據(jù),建立星級、評論、幫助評論三者關(guān)系的模型,其中評論為文本型數(shù)據(jù),需要將其量化,在考慮vine與verified_purchase對評價有用性的影響,使用層次分析法得到各部分權(quán)重,得出該評論者反映的產(chǎn)品綜合評分,分析產(chǎn)品綜合評分的趨勢,以此反應(yīng)產(chǎn)品聲譽的上升或下降。
以亞馬遜網(wǎng)站上的評論為研究對象,從評論(reviews)、評價星級(star ratings)、helpfulness rating的數(shù)字特征出發(fā),建立他們之間的關(guān)系模型。本文采用經(jīng)過處理的文本情感數(shù)據(jù)作為評論文本的一個parameter,將其中的情感極性量化到[-1,1]的范圍內(nèi),數(shù)值越接近-1表明負(fù)面情感更強烈,數(shù)值越接近1表示積極情感更強烈。[1]亞馬遜通過讓消費者對產(chǎn)品打分(星級1-5星),1星表示極端差評,3星表示中性。[2]極端性值越接近-1表明負(fù)面情感更強烈,數(shù)值越接近1表示積極情感更強烈。由于文本評論過于復(fù)雜、不夠直觀,因而利用情感分析技術(shù)將文本評論數(shù)字化,利用加權(quán)平均算法式(1)計算,可有效提高通用領(lǐng)域情感分類的效率和準(zhǔn)確率。

其中:
-Np:表達(dá)正面情感的詞匯數(shù)目
-Nn:表達(dá)負(fù)面情感的詞匯數(shù)目
-WPi:正面情感詞匯權(quán)值
-WPj:負(fù)面情感詞匯權(quán)值
本文利用其定性與定量相結(jié)合處理各種決策因素的特點,將層次分析法運用到評審意見的綜合評定上。本文將客戶評論綜合評分定義為目標(biāo)層,將5個指標(biāo)(評論文本、星級評定、幫助性評定、vine voices、驗證購買)定義為準(zhǔn)則層,將每一個客戶回顧定義為方案層,建立層次結(jié)構(gòu)模型,通過前面的數(shù)據(jù)處理,以及相關(guān)關(guān)系分析,構(gòu)造各準(zhǔn)則層的判斷矩陣如下(矩陣a~c)。

(a)Reviews and Ratings

(b)Other influencing factors

(c)Comprehensive Score
計算每個判斷矩陣的歸一化特征向量wk,最大特征值λmax和一致性比率CR,其中k為判斷矩陣a~c,通過了一致性檢驗,再對每個準(zhǔn)則層的特征向量進行處理,得到每一個指標(biāo)的權(quán)重,可以得到每一個用戶對于商品的總評分。


表1 吹風(fēng)機的詞頻
其中:-:第j類的商品總平均分提取前百分之二十,這部分都是評價較高的商品類別。具有該種特征的商品就是不合格產(chǎn)品。
從表1中的詞頻數(shù)據(jù)可分析得到,消費者更注重吹風(fēng)機的特殊專利技術(shù) (“ionic”“turbo”“tourmaline”)、材質(zhì)(“ceramic”)、功 率(“watt”)、顏色(“black”“blonde”)和便攜性(“l(fā)ight”)。同理,也篩選出了其他兩種產(chǎn)品的最受消費者關(guān)注的幾個特征:
微波爐——功率、size、加熱器、節(jié)能、轉(zhuǎn)盤
奶嘴——材質(zhì)、形狀、口徑大小、軟硬度
本文首先從評論特征方面選取評論文本的情感極端性、評論的主觀性、評論長度進行研究。本文采用其中的情感極性量化,用5個星級評價測量消費者的對產(chǎn)品的態(tài)度。其次利用其定性與定量相結(jié)合處理各種決策因素的特點,將層次分析法運用到評審意見的綜合評定上。最后得到每一個用戶對于商品的總評分。