999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于在線評論的區域需求偏好識別方法

2019-08-19 11:50:30王安寧彭張林
中國管理科學 2019年7期
關鍵詞:特征滿意度區域

王安寧,張 強,彭張林,倪 鑫

(1.合肥工業大學管理學院,安徽 合肥 230009;2.過程優化與智能決策教育部重點實驗室,安徽 合肥 23009)

1 引言

在競爭激烈的細分市場中,產品或服務的成功主要依賴于如何滿足用戶的需求[1-2]。為了避免單純的價格競爭,企業必須從用戶需求出發進行下一代產品的改進與創新[3]。Tietz等[4]已經證實將用戶納入到產品的設計過程比單純地將其作為產品的消費者更加有效,特別是產品領先用戶的參與,能夠幫助企業及時把握市場需求動向,獲取更多的產品創新源泉[5]。因此,用戶作為產品使用者參與產品的設計與開發過程已經成為產品創新的發展趨勢。其中,準確地獲取用戶的需求是產品設計的關鍵環節。傳統的問卷調查和用戶訪談等用戶需求獲取方法存在投入成本高、花費時間長,樣本量較小等諸多局限[6]。隨著在線社交媒體的快速發展,越來越多的用戶傾向通過在線社交媒體表達自己的消費體驗。研究表明77%消費者在購買之前會瀏覽在線評論,并且相比個人推薦,75%消費者更加相信在線評論[7]。在線評論成為了用戶購買決策的關鍵影響因素[8-11]。

相比較于傳統的用戶需求獲取方法,從在線評論中獲取用戶需求存在如下優勢:1)數據來源于真實用戶的主動分享,并不依賴于被動的調研和訪談[8];2)樣本量大,而且數據易獲取[12];3)數據內容豐富,包含了各種產品特征。這些在線評論包括用戶對產品多個特征的評價,并帶有正面或負面的態度。因此,社交媒體中的在線評論成為企業挖掘用戶需求的重要信息資源[13-16]。當前研究工作圍繞著產品特征的提取[17]、情感分析[18]和重要性識別[19-20]等方面,采用了計量經濟學等模型對在線評論中產品特征偏好進行合計,并反饋到下一代產品的開發過程[9,21]。

從在線評論中提取產品特征是獲取用戶需求偏好至關重要的一步。產品特征一般可分為兩類,一類是由企業提供的產品結構和性能,一類是用戶提出的產品屬性[22]。Hu和Liu[23]認為產品特征通常為名詞或名詞短語,提出使用詞性分析方法。此外,分析特征的情感可以幫助企業明白產品的成功和失敗,以便更好地適應市場需求的改變。Tuarob和Tucker[24]提出利用情感分析量化產品的市場支持度,識別成功和失敗的產品,并將產品特征自動分成兩類:滿意特征和抱怨特征。

用戶偏好識別對于理解用戶需求至關重要,在企業的產品規劃以及產品設計過程中扮演重要角色。一些學者采用計量經濟學和統計學方法確定不同產品特征的偏好程度[25-26]。為了縮短數據收集時間和降低調研成本,Fader和Hardie[27]利用銷售點數據提出離散選擇模型計算不同產品特征的用戶偏好。近幾年,在線評論成為獲取用戶偏好的一種重要信息資源,對企業的市場定位、市場細分、新產品開發以及廣告投放都必不可少[28]。Decker等[8]基于在線評論的打分行為提出了一種計量經濟學的框架去計算產品特征的偏好系數。

目前,相關研究工作主要側重于用戶綜合偏好的識別,忽視了區域特征對用戶偏好的影響。區域特征作為企業區域化經營策略以及個性化產品設計需要考慮的重要維度,是用戶偏好識別的關鍵要素。以汽車產品為例,用戶偏好受到區域地理環境的影響,山地地區的用戶更加重視汽車的動力效果。此外,大城市和中小城市用戶的需求則可能會由于消費觀念的不同而產生差異。例如大城市用戶節能環保意識較好,可能更加重視汽車產品的油耗性能。因此,相比較于不考慮區域特征得到的用戶綜合需求偏好,如何識別顯著的區域需求偏好成為了在線評論分析的關鍵問題之一。用戶需求偏好一般包括產品需求偏好和特征需求偏好兩個層次,產品需求偏好表現為用戶對產品的滿意度[24],特征需求偏好表現為用戶對產品特征的情感極性[19-20]。

鑒于此,本文將利用文本挖掘方法提取產品評論中的“特征-觀點”對,并識別產品特征的情感極性(正面或者負面)。然后,基于特征觀點計算每條評論的產品滿意度。最后,利用卡方檢驗模型和方差分析模型分別驗證特征情感極性和產品滿意度與區域特征的關聯關系,并發現其中顯著的區域需求偏好。

2 研究模型

2.1 問題定義

目前研究大多選用易于量化的指標來度量產品滿意度,例如用戶評分等級、評論數量等,忽視了產品評論內容中各維度的信息。由于產品具有多特征的特點,用戶對各產品特征的態度構成了用戶對產品的滿意度。基于這種考慮,本文提出了一種基于用戶對產品特征態度的方法量化產品滿意度。此外,由于不同區域的人文、經濟以及地理環境都存在一定的差異,導致用戶對產品性能的偏好并不相同。因此,對于同一款產品在不同區域受歡迎程度是存在差異的。為此,本文定義如下三個子問題:(1)構建面向特征的產品滿意度計算方法;(2)構建卡方檢驗模型識別產品特征情感極性與區域特征的關聯關系;(3)構建方差分析模型識別產品滿意度與區域特征的關聯關系。

對于區域特征,本文選取了城市等級和城市地區兩個維度,城市等級主要是反映區域的經濟,而城市地區主要是反映是區域的人文與環境。其中對于城市等級,本文根據2016中國城市等級劃分設置為{一線城市,二線城市,三線及以下城市}。而對于城市地區,根據中國自然地理特征將城市地區劃分為七大區域,包括{華東,華南,華北,華中,東北,西北,西南}。

2.2 方法框架

3 特征情感極性與產品滿意度

3.1 “特征-觀點”對的提取

給定產品評論集合R={r1,r2,…,rn},其中每條用戶評論可以看作為一組“用戶—特征—觀點”對的集合,即:rk={(uk,fj,oj)|fj∈rk}。

其中,元素(uk,fj,oj)表示用戶uk對特征fj的觀點態度為oj。研究表明在用戶評論中產品特征通常是名詞或名詞短語[23]。本文采用POS標記對用戶評論進行詞性標注,將名詞與名詞短語視為

圖1 基于在線評論的區域用戶需求偏好識別方法架構

特征詞的候選集。通過對名詞和名詞短語進行關聯規則挖掘,提取頻繁項集,作為新的特征候選集,一般僅考慮頻繁一項集和頻繁二項集。得到的頻繁項還需要進行剪枝,主要是去除單字名詞和過濾一些常見名詞但又不是產品特征詞,例如“問題”、“家人”等[29]??紤]到很多特征詞表達的是同一產品特征,例如汽車產品的 “外觀”、“外形”、“車身”等特征詞反映的都是汽車外觀的整體情況。本文利用WordNet同義詞詞庫將特征候選集進行同義詞整合,形成產品特征詞庫[30]。此外,特征的觀點詞通常都是形容詞,并在特征詞附近,比如:外觀顯得大氣,車頭十分飽滿等。本文先根據特征的觀點詞屬于積極詞庫還是消極詞庫作為初步的情感極性;再判斷是否存在否定或雙重否定的情況,如果存在否定,則轉換特征觀點的情感極性,若是雙重否定則不變。

3.2 產品特征的情感分析

“用戶-特征-觀點”對(uk,fj,oj)是用戶對產品特征表達個人觀點。從情感分析角度,一般可分為兩個維度來描述用戶觀點:極性與強度。情感極性是描述用戶的正負面態度;情感強度是描述用戶態度強弱。用戶uk對特征fj的情感極性記為ek(fj),如果情感極性屬于積極,則ek(fj)值為1;如果情感極性屬于消極,則ek(fj)的值為0。

特征fj的情感強度記為ik(fj),一般分為三個等級:加強型,一般型與削弱型。觀點附近出現“非?!?、“很”等有加強情感傾向的副詞,視為加強型;出現“比較”、“還”等有削弱情感傾向的副詞,視為削弱型;沒有出現相關副詞,視為一般型。對于情感強度的量化,一般采用如下規則[30]:加強型情感,賦值為5;一般型情感,賦值為3;削弱型情感,賦值為1。

3.3 產品滿意度計算

用戶uk對產品的滿意度sk,本文用概率p(sk)表示對產品滿意的概率。根據全概率公式:

p(sk)=∑p(sk/fj)p(fj)

(1)

其中,p(fj)為特征fj的權重wj,表示用戶uk對特征fj的重視程度。本文考慮情感強度i和描述內容長度l兩個因素來衡量特征的權重。為了確保wj的值在0到1之間,可以定義為公式(2):

(2)

(3)

4 識別需求偏好與區域特征的關聯關系

受區域經濟、人文以及環境等因素的影響,特征情感極性和產品滿意度與區域特征存在一定的關聯關系。因此,本節包括兩方面內容:(1)構建卡方檢驗模型識別產品特征情感極性與區域特征的關聯關系;(2)構建方差分析模型識別產品滿意度與區域特征的關聯關系。

4.1 特征情感極性與區域特征的關聯關系識別

特征情感極性是定性變量,屬性值只有正面和負面。因此,本文采用交叉表卡方檢驗識別特征情感極性與區域特征的關聯關系。本節以城市等級為例,根據城市等級和特征情感極性,評論被分成6組,如表1。Rk表示城市等級k的評論數量,Ci表示特征情感極性ei的評論數量,nki表示城市等級k,并且特征情感極性ei的評論數量。

表1 城市等級-產品特征交叉表

原假設H0:對于產品p,用戶對特征fj的情感極性與用戶所在城市等級之間相互獨立。

備選假設H1:對于產品p,用戶對特征fj的情感極性與用戶所在城市等級存在關聯關系。

基于原假設H0,得到如下公式:

pki=pkpi

(4)

(5)

(6)

其中,pki表示評論既屬于城市等級k,特征情感極性又為ei的概率;pk表示評論屬于城市等級k的概率;pi表示特征的情感極性為ei的概率。

Eki表示既屬于城市等級k,且對特征fj的情感極性為ei的期望評論數,易得:

(7)

根據卡方檢驗模型,特征情感極性與城市等級的卡方統計量計算公式如(11)所示:

(8)

4.2 產品滿意度與區域特征的關聯關系識別

本文結合城市等級和城市地區兩個區域特征,構建方差分析模型識別產品滿意度與區域特征的關聯關系。因此,該問題可以分解成三個子問題:(1)識別城市等級與產品滿意度的關聯關系;(2)識別城市地區與產品滿意度的關聯關系;(3)識別城市等級和城市地區交互效應與產品滿意度的關聯關系。

(1)城市等級與產品滿意度的關聯關系

原假設H0:對于產品p,不同城市等級的產品滿意度均值沒有差異。

備選假設H1:對于產品p,不同城市等級的產品滿意度均值存在差異

(2)城市地區與產品滿意度的關聯關系

原假設H0:對于產品p,不同城市地區的產品滿意度均值沒有差異。

備選假設H1:對于產品p,不同城市地區的產品滿意度均值存在差異

(3)城市等級和城市地區交互效應與產品滿意度的關聯關系

原假設H0:對于產品p,城市等級因素和城市地區因素對的產品滿意度均值沒有交互效應影響。

備選假設H1:對于產品p,城市等級因素和城市地區因素對的產品滿意度均值有交互效應影響。

(9)

此外,SSA,SSB,SSAB分別計算如下:

(10)

(11)

(12)

SSE=SST-SSA-SSB-SSAB

(13)

若F≥Fα,拒絕原假設H0,接受備選假設H1。F值越大,說明影響程度越大。通過上述方差分析模型,可以驗證區域特征對產品滿意度的影響程度以及檢驗是否存在顯著影響,并得出產品滿意度與區域特征的關聯關系。

表2 方差分析表

注:因素A表示城市等級,因素B表示城市地區;df為自由度,n表示樣本總數,SS為方差平方和,MS=SS/df

5 案例研究

5.1 實驗設計

5.1.1 數據收集與預處理

本文數據來源汽車之家(autohome.com.cn)的口碑,口碑是由購買相應車型的用戶發表。本文以瑞虎5車型和艾瑞澤5車型為案例,共獲取有效口碑樣本4448條。由于汽車產品的層次結構復雜,特征眾多。為了便于分析,將評論中的眾多特征整合成:外觀、空間、內飾、油耗、動力、操控、舒適性和性價比八個特征。根據本文第3節提出的“特征-觀點”提取、情感極性判定以及產品滿意度計算,得到特征情感極性和產品滿意度的結構化數據,如表3所示。

表3 評論的特征情感極性和產品滿意度結構化數據

5.1.2 特征情感極性與產品滿意度分布

根據產品特征情感極性和產品滿意度的結構化數據,統計特征情感極性,如圖2和圖3所示。其中,艾瑞澤5的空間和外觀性能優異,而動力、內飾和油耗的抱怨則較多。瑞虎5的操控、舒適性以及性價比表現突出,而油耗、外觀,尤其是空間,負面情感較多。

圖2 艾瑞澤5車型產品特征情感極性的分布

圖3 瑞虎5車型產品特征情感極性的分布

對于產品滿意度的分布,均值越大,說明產品口碑越好。方差越小,說明品牌感知較一致。圖4展示了瑞虎5和艾瑞澤5的滿意度分布,可以發現瑞虎5車型的滿意度大致服從正態分布,均值不大,同時方差也不大,說明口碑一般,用戶感知較一致。而艾瑞澤5車型的滿意度大致服從線性分布,均值較大,同時方差也較大,說明口碑較好,用戶感知存在差異,部分用戶的需求偏好沒有得到滿足。

圖4 產品滿意度的分布

圖5 艾瑞澤5車型不同城市等級的產品特征極性均值

圖6 艾瑞澤5車型不同城市地區的產品特征極性均值

圖7 瑞虎5車型不同城市等級的產品滿意度分布

圖8 瑞虎5車型不同城市地區的產品滿意度分布

本文主要研究特征情感極性和產品滿意度的區域差異。為了便于觀察,圖5和圖6分別展示了艾瑞澤5車型各產品特征情感極性均值在不同城市等級和城市地區的分布差異。從圖5可以發現動力、油耗和舒適性在不同城市等級的分布差異較大。其中,對于油耗特征,城市等級越高,情感極性均值越低,這與大城市的交通擁堵和節能環保意識較高相符合。從圖6可以發現空間、動力、油耗、操控和舒適性在不同城市地區的分布差異很大,其中,動力和油耗的情感極性均值在西南地區都比較低,說明西南地區的用戶對油耗和動力的性能比較重視。

圖7和圖8分別展示了瑞虎5車型產品滿意度在不同城市等級和城市地區的分布差異??梢园l現不同城市等級的產品滿意度分布差異并不大,而不同城市地區的產品滿意度分布存在較大差異,其中西北地區產品滿意度均值明顯低于其他地區。

5.2 實驗結果分析

5.2.1 特征情感極性與區域特征的關聯關系

對于產品特征情感極性與區域特征的關聯關系,本文分別建立城市等級和城市地區與產品特征情感極性的卡方檢驗模型,其檢驗結果如表4和表5所示。結果發現空間和油耗的情感極性與城市等級的關聯程度較大。對于油耗特征,瑞虎5車型和艾瑞澤5車型分別為5.129和12.175,接近或高于5.991。說明油耗在不同城市等級的情感極性分布存在較顯著差異。圖9展示了瑞虎5和艾瑞澤5不同城市等級的油耗特征正面評論與期望正面評論之差??梢园l現兩款車型的分析結果比較一致,其中,三線及以下城市的油耗正面情感極性的評論數量明顯高于期望值,而一線城市對油耗正面情感極性的評論數量則明顯低于期望值。這說明三線及以下城市用戶對油耗性能的要求相對較低,而一線城市用戶則更加看重油耗性能。

此外,空間和外觀的情感極性受城市地區因素的影響顯著,尤其是空間特征,瑞虎5和艾瑞澤5的卡方值達到14.134和13.834,都高于12.593。圖10展示了瑞虎5和艾瑞澤5不同城市地區的空間特征正面評論與期望正面評論之差??梢园l現瑞虎5和艾瑞澤5空間特征的區域偏好并不一致,主要是由于瑞虎5屬于SUV車型,而艾瑞澤5屬于轎車,兩者的用戶對空間特征的需求差別很大。對于瑞虎5車型,東北和華南地區的空間特征正面情感極性的評論數量明顯高于期望值,而西北地區的正面情感極性的評論數量則明顯低于期望值,說明東北和華南地區的用戶對瑞虎5車型的空間特征比較滿意,而西北地區的用戶可能由于對SUV車型空間特征要求相對更高,導致對瑞虎5車型的空間特征還不是很滿意。對于艾瑞澤5車型,東北地區的用戶對艾瑞澤5車型的空間特征比較滿意,而華中地區用戶則相對還不是很滿意。綜合來看,東北地區用戶相對來說對兩種車型的空間特征需求并不高,而西北地區用戶對SUV車型空間要求相對較高,華中地區用戶對轎車空間要求相對較高。

表4 瑞虎5車型的產品特征-情感極性區域特征的卡方值

表5 艾瑞澤5車型的產品特征-情感極性區域特征的卡方值

圖9 不同城市等級的油耗特征正面評論期望落差

圖10 不同城市地區的空間特征正面評論的期望落差

5.2.2 產品滿意度與區域特征的關聯關系

對于產品滿意度與區域特征的關聯關系,本文得出瑞虎5和艾瑞澤5車型的方差分析結果分別如表6和7表所示。其中,瑞虎5車型的產品滿意度與城市等級的Sig.值為0.660,說明受城市等級的影響較小。而城市地區的Sig.值為0.262,說明一定程度上存在較顯著影響。若僅對城市地區與產品滿意度的單因素方差分析如表8,發現Sig.的值為0.041,說明城市地區在一定程度上對產品滿意度產生了顯著影響。同時,艾瑞澤5車型的城市等級和城市地區Sig.的值分別為0.041和0.023,如表7所示。說明艾瑞澤5車型的滿意度同時受城市等級和城市地區的顯著影響。

5.3 算法驗證

5.3.1 特征提取及其情感分析的驗證

為進一步說明實驗結論的有效性,需要驗證產品特征提取及其情感極性判定方法的有效性。本文從在線評論數據中隨機抽取50條,進行人工產品特征和情感極性標注,標注結果包含16個特征,117次特征情感極性描述。對于產品特征的提取,在保證準確率不是太低的情況下,召回率要盡可能大,從而保證最終形成的產品特征詞庫盡可能多地包含用戶描述的產品特征。

表6 瑞虎5車型產品滿意度的方差分析

表7 艾瑞澤5車型產品滿意度的方差分析

表8 城市地區與產品滿意度的單因素方差分析結果

特征提取算法中,頻繁項集的支持度大小設置決定了特征提取的準確率和召回率。表9顯示了不同支持下的特征提取的準確率、召回率以及F1值。隨著支持度的增加,準確率呈上升趨勢,召回率呈下降趨勢,F1值呈下降趨勢,支持度設置大約在0.03左右為最佳。

表9 不同支持度下的產品特征提取實驗

對于產品特征的情感分析,本實驗使用已標注數據(正負樣例)訓練了情感詞典,得到了1484個情感詞。通過50條標注評論的檢驗,117個情感極性標注被正確識別出109個。準確率達到93.2%,而常用的樸素貝葉斯算法準確率僅為87.6%,主要是由于本文方法是具體地針對每條評論中每個產品特征的情感詞來識別情感極性,因而具有更高的準確率。

5.3.2 產品滿意度驗證

產品滿意度在一定程度上與用戶打分保持一致。滿意度越高,打分越高。很多在線評論網站,都提供在線打分,汽車之家網站上有大量打分數據。實驗獲取了2000個艾瑞澤5車型的用戶打分,對比本文方法得到的產品滿意度,兩者皮爾遜相關系數為0.91,說明本文方法計算的產品滿意度具備一定的可靠性。此外,我們計算每個打分下的產品滿意度均值,如圖11所示。可以看出打分越高,滿意度均值越高。

圖11 打分和滿意度的關系圖

6 結語

本文首先利用特征提取與情感分析方法處理在線評論文本,識別用戶對產品特征的情感極性以及量化用戶對產品的滿意度。再考慮城市等級和城市地區兩個因素對區域需求偏好的影響,分別采用卡方檢驗模型和方差分析模型驗證特征情感極性和產品滿意度與區域特征之間的關聯關系,發現存在顯著區域差異的產品特征。

本文利用汽車之家網站的瑞虎5和艾瑞澤5的評論數據驗證了模型的有效性。實驗結果表明,油耗、空間、外觀和內飾等特征的情感極性以及產品滿意度受區域因素的顯著影響。本文研究建立起了產品特征情感極性與區域特征的關聯關系,為企業的區域化產品配置設計與營銷策略提供理論依據。

此外,由于區域的人文經濟以及環境條件是隨著時間不斷改變的。企業需要及時把握這種變化來改進和創新產品以適應不斷改變的用戶需求偏好。因此,未來的研究我們將進一步探索區域用戶需求偏好的變化趨勢和規律。

猜你喜歡
特征滿意度區域
多感謝,生活滿意度高
工會博覽(2023年3期)2023-04-06 15:52:34
16城市公共服務滿意度排行
小康(2021年7期)2021-03-15 05:29:03
淺談如何提升脫貧攻堅滿意度
活力(2019年19期)2020-01-06 07:34:38
如何表達“特征”
明天村里調查滿意度
雜文月刊(2019年15期)2019-09-26 00:53:54
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關于四色猜想
分區域
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 久操中文在线| 亚洲色图综合在线| 免费国产小视频在线观看| 国产无码精品在线| 永久免费无码成人网站| 亚洲不卡影院| 天堂网国产| 国产精品亚洲一区二区三区z| 日韩一区二区在线电影| 天堂中文在线资源| 色综合天天操| 亚洲浓毛av| 色综合五月婷婷| 韩日午夜在线资源一区二区| 亚洲色图欧美| 欧美日韩精品在线播放| 亚洲综合亚洲国产尤物| 永久成人无码激情视频免费| 久久精品无码一区二区日韩免费| 天天摸夜夜操| 欧美福利在线| 久热re国产手机在线观看| 国产午夜不卡| 欧美久久网| 精品无码一区二区三区电影| 国产精品综合色区在线观看| 欧美日韩在线亚洲国产人| 最近最新中文字幕在线第一页 | 国产精品成人不卡在线观看| 日本亚洲国产一区二区三区| AV不卡在线永久免费观看| 亚洲精品波多野结衣| 亚洲国产欧美中日韩成人综合视频| 欧美一级大片在线观看| 亚洲中文在线视频| 四虎在线高清无码| 99精品在线看| 在线国产欧美| 丁香婷婷综合激情| 五月婷婷中文字幕| 97视频在线观看免费视频| 国产精品视频观看裸模| 国产视频只有无码精品| 国产va在线观看免费| 亚洲一欧洲中文字幕在线| 免费视频在线2021入口| 人人妻人人澡人人爽欧美一区 | 国产乱子伦无码精品小说| 亚洲天堂在线免费| 欧美精品成人一区二区在线观看| 免费国产在线精品一区 | 亚洲精品福利视频| a毛片免费在线观看| 高潮毛片无遮挡高清视频播放| 性视频久久| 亚洲人成在线精品| 精品亚洲欧美中文字幕在线看| 久久这里只有精品国产99| 亚洲成综合人影院在院播放| 在线无码私拍| 国产精品久久自在自线观看| 最新国产网站| 亚洲天堂成人| 国产自在线播放| 国产原创自拍不卡第一页| 少妇精品网站| 午夜国产在线观看| 亚洲久悠悠色悠在线播放| 国产精品成人免费视频99| 亚洲VA中文字幕| 四虎国产在线观看| 色悠久久综合| 中文无码影院| 波多野结衣一二三| 亚洲人成色77777在线观看| 日韩成人免费网站| 亚洲 欧美 日韩综合一区| 天天色天天操综合网| 久久亚洲黄色视频| 亚洲天堂视频在线观看免费| 99爱在线| 欧美一道本|