999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向不平衡網(wǎng)絡(luò)評(píng)論數(shù)據(jù)挖掘的服務(wù)質(zhì)量評(píng)價(jià)

2021-03-13 06:00:46顧永春顧興全洪彩鳳金世舉
關(guān)鍵詞:主體評(píng)價(jià)

顧永春,顧興全,武 嬌,洪彩鳳,金世舉

1(中國(guó)計(jì)量大學(xué) 理學(xué)院,杭州 310018)

2(中國(guó)計(jì)量大學(xué) 標(biāo)準(zhǔn)化學(xué)院,杭州 310018)

1 引 言

隨著我國(guó)旅游業(yè)由高速增長(zhǎng)向高質(zhì)量發(fā)展轉(zhuǎn)變,酒店服務(wù)質(zhì)量[1,2]越來(lái)越成為各類酒店在激烈的市場(chǎng)競(jìng)爭(zhēng)中取得優(yōu)勢(shì)的關(guān)鍵因素之一,因此,對(duì)酒店服務(wù)質(zhì)量的評(píng)價(jià)受到越來(lái)越多的重視和應(yīng)用.酒店服務(wù)質(zhì)量評(píng)價(jià)是指以顧客感知[3,4]為基礎(chǔ),以顧客評(píng)價(jià)為參照,以顧客滿意為目標(biāo),一切從顧客出發(fā)的服務(wù)管理行為.國(guó)內(nèi)外學(xué)者從顧客出發(fā),對(duì)酒店服務(wù)質(zhì)量評(píng)價(jià)方法進(jìn)行了大量研究,從評(píng)價(jià)數(shù)據(jù)來(lái)源來(lái)看,這些方法大致可以分為兩類:一類是以調(diào)查問卷為信息數(shù)據(jù)來(lái)源的研究方法.例如,尹華光等[5]以3個(gè)方面、24個(gè)問題為基本結(jié)構(gòu)設(shè)計(jì)問卷,利用修改后的SERVQUAL量表來(lái)測(cè)評(píng)張家界高星級(jí)酒店顧客對(duì)服務(wù)質(zhì)量的期望和感知.Nunkoo等[6]通過447份問卷對(duì)南非各星級(jí)酒店服務(wù)質(zhì)量的顧客滿意度進(jìn)行了深入調(diào)查研究,為不同星級(jí)酒店提高服務(wù)質(zhì)量和顧客滿意度提供了有針對(duì)性的指導(dǎo)意見.但問卷設(shè)計(jì)嚴(yán)重依賴專家經(jīng)驗(yàn),受主觀影響較大,無(wú)法反映問卷未涉及到的服務(wù)項(xiàng)目質(zhì)量,并且數(shù)據(jù)獲取成本過高.另一類是以網(wǎng)絡(luò)評(píng)論為數(shù)據(jù)來(lái)源的研究方法.網(wǎng)絡(luò)評(píng)論因其傳播速度快,具有實(shí)時(shí)性,獲取成本低,并且完全來(lái)自顧客親身體驗(yàn)等特點(diǎn)而受到廣泛關(guān)注,基于網(wǎng)絡(luò)評(píng)論的服務(wù)質(zhì)量評(píng)價(jià)正逐漸成為研究主流.這類方法通常使用自然語(yǔ)言處理(Natural Language Processing,NLP )技術(shù)對(duì)網(wǎng)絡(luò)評(píng)論文本數(shù)據(jù)進(jìn)行預(yù)處理,然后根據(jù)文本的詞頻(Term Frequency,TF)[7]或詞頻逆文檔頻率(Term Frequency Inverse Document Frequency,TFIDF)[8]等統(tǒng)計(jì)信息選取特征詞作為研究主體的服務(wù)質(zhì)量特征,最后利用聚類[9]和情感分析[10,11]構(gòu)建計(jì)量經(jīng)濟(jì)模型分析服務(wù)質(zhì)量與顧客滿意度的關(guān)系.

盡管基于網(wǎng)絡(luò)評(píng)論構(gòu)建的服務(wù)質(zhì)量評(píng)價(jià)模型能夠從顧客自身體驗(yàn)的角度以更少的人工成本提供更為客觀的評(píng)價(jià)結(jié)果,但是由于網(wǎng)絡(luò)獲取的評(píng)論數(shù)據(jù)通常分布不均衡,使得上述方法在實(shí)際應(yīng)用中存在一些問題.首先,以TF作為特征選擇的權(quán)值,會(huì)導(dǎo)致評(píng)論數(shù)目多的主體特征明顯,評(píng)論數(shù)目少的主體特征不夠顯著,進(jìn)一步導(dǎo)致行業(yè)共性特征被某些個(gè)性特征所替代.其次,很多基礎(chǔ)性服務(wù)特征詞會(huì)重復(fù)出現(xiàn)在多個(gè)酒店評(píng)論中,如果一個(gè)服務(wù)特征詞在不同酒店評(píng)論中出現(xiàn)次數(shù)越多,說(shuō)明該特征受到的關(guān)注越廣泛,越能代表行業(yè)共性.還有,雖然TFIDF是一個(gè)很好的分類特征,但是評(píng)論數(shù)據(jù)分布不均衡使得這種代表行業(yè)共性的特征詞的TFIDF值相對(duì)較低,從而導(dǎo)致其重要程度被錯(cuò)誤判定.此外,在根據(jù)權(quán)重大小選取特征詞方面,傳統(tǒng)方法存在缺乏客觀性的問題,通常都是依靠主觀經(jīng)驗(yàn)人為確定.另一種方法是利用齊普夫定律確定高頻詞進(jìn)行特征詞選擇,但該方法在許多情況下效果并不理想[12].在情報(bào)學(xué)領(lǐng)域,G指數(shù)(G-index)[13]被用于衡量高質(zhì)量論文對(duì)學(xué)者學(xué)術(shù)成就的貢獻(xiàn)和評(píng)價(jià)期刊學(xué)術(shù)影響力等問題.近年來(lái),文本挖掘領(lǐng)域的共詞分析研究中出現(xiàn)一些應(yīng)用G指數(shù)確定高頻詞的方法[14,15],取得較好的效果.最后,在服務(wù)質(zhì)量評(píng)價(jià)計(jì)算模型中,當(dāng)不同評(píng)價(jià)主體的評(píng)論數(shù)據(jù)分布不均衡時(shí),會(huì)導(dǎo)致評(píng)論數(shù)量少的主體的評(píng)分趨于極高或極低的極端情況,從而引起評(píng)分不準(zhǔn)確、顧客對(duì)各個(gè)主體服務(wù)質(zhì)量滿意度排名不合理等問題.

針對(duì)在酒店服務(wù)質(zhì)量評(píng)價(jià)模型構(gòu)建中由評(píng)論數(shù)據(jù)不均衡導(dǎo)致的上述問題,本文首先提出一種用于特征選擇的主體頻率(Subject Frequency,SF)權(quán)重,通過統(tǒng)計(jì)包含特征詞的主體所占的比例來(lái)定義某特征詞對(duì)行業(yè)共性表示的重要程度.其次,本文借鑒G指數(shù)的構(gòu)建思想,提出SF-G指數(shù)用于對(duì)高頻特征詞的客觀選取,建立服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系.第三,在服務(wù)質(zhì)量評(píng)分模型中,本文提出一種基于熱度指數(shù)加權(quán)的顧客滿意度評(píng)分方法,以定義的熱度指數(shù)反映不同主體受顧客關(guān)注度的大小,從而有效地弱化數(shù)據(jù)不均衡產(chǎn)生的評(píng)價(jià)結(jié)果失真.最后,利用酒店網(wǎng)絡(luò)評(píng)論數(shù)據(jù)對(duì)本文的評(píng)價(jià)模型及方法進(jìn)行實(shí)證分析.

2 服務(wù)質(zhì)量指標(biāo)體系構(gòu)建

面向不平衡網(wǎng)絡(luò)評(píng)論的酒店服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系構(gòu)建主要包括以下步驟:1) 網(wǎng)絡(luò)評(píng)論文本數(shù)據(jù)的采集和預(yù)處理;2) 詞的向量表示;3) 特征詞選擇;4) 特征詞聚類提取評(píng)價(jià)指標(biāo).構(gòu)建流程如圖1所示.

圖1 服務(wù)質(zhì)量指標(biāo)體系構(gòu)建流程Fig.1 Construction of service quality index system

2.1 語(yǔ)料獲取及預(yù)處理

本文以酒店評(píng)論為研究對(duì)象,利用集搜客(1)http://www.gooseeker.com/網(wǎng)絡(luò)爬蟲工具獲取貓途鷹網(wǎng)站(2)https://www.tripadvisor.cn/上中國(guó)所有省、直轄市、自治區(qū)(包括港澳臺(tái)地區(qū))的五星級(jí)酒店的中文顧客評(píng)論.為保證評(píng)論的有效性,首先需要對(duì)網(wǎng)絡(luò)抓取的評(píng)論文本進(jìn)行清洗,去除文本中的網(wǎng)頁(yè)格式等無(wú)用信息.然后,對(duì)每條評(píng)論進(jìn)行中文分詞和詞性標(biāo)注,并去除停用詞.本文使用python的第三方工具包jieba分詞和哈工大停用詞表進(jìn)行中文分詞和去除停用詞等預(yù)處理工作.

2.2 詞向量表示

V={(w,v,wPOS)|w∈V,v∈RM}

(1)

2.3 特征詞提取

特征詞提取的方法很多,大多是基于特征規(guī)則排序的,例如將TF和TFIDF作為詞的權(quán)值,通過對(duì)權(quán)值的排序提取特征詞.評(píng)論語(yǔ)料詞典V中的某個(gè)詞W的TF和TFIDF權(quán)值的數(shù)學(xué)表示分別為:

(2)

(3)

其中,f(·)是權(quán)值函數(shù),nw,d是詞w在評(píng)論d∈D中出現(xiàn)的次數(shù),∑d∈Dnw,d是詞w在評(píng)論語(yǔ)料集D中出現(xiàn)的次數(shù),∑d∈D∑w∈dnw,d是D中所有的詞出現(xiàn)的次數(shù),Nw是D中包含詞w的評(píng)論數(shù),N是D中評(píng)論總數(shù).將V中所有詞的TF和TFIDF權(quán)值從大到小進(jìn)行排序,指定待選取的特征詞個(gè)數(shù)|W|,選擇前|W|個(gè)具有最大權(quán)值的詞為特征詞.或者,給定一個(gè)特征選擇的閾值f0,將每個(gè)詞的TF和TFIDF權(quán)值與其進(jìn)行比較,得到特征詞集合

W={(w,v,wPOS)|f(w)>f0,(w,v,wPOS)∈V}

(4)

這里,f0可以看成區(qū)分高頻詞和低頻詞的臨界值,通常選取高頻詞作為特征詞.

如前所述,在評(píng)論語(yǔ)料分布不均衡時(shí),一方面TF和TFIDF權(quán)值會(huì)導(dǎo)致體現(xiàn)主體個(gè)性特征的詞被錯(cuò)判成刻畫行業(yè)共性的特征詞,并容易弱化代表行業(yè)共性的特征詞的重要度;另一方面,上述的特征選擇方法依靠主觀經(jīng)驗(yàn),缺乏客觀性.本節(jié)提出主體頻率(SF)權(quán)值和基于主體頻率的G(SF-G)指數(shù)模型來(lái)解決這些問題.

2.3.1 SF權(quán)值

本文將服務(wù)質(zhì)量評(píng)價(jià)的對(duì)象稱為主體(Subject),例如酒店,不同的酒店對(duì)應(yīng)于不同的主體.假設(shè)評(píng)論語(yǔ)料集D是由來(lái)自于P個(gè)不同主體S1,…,SP的子語(yǔ)料集D1,…,DP組成,即D={D1,…,DP}.將D中的評(píng)論進(jìn)行分詞和Word2Vec詞向量訓(xùn)練后,對(duì)每個(gè)主體Sp可得到其對(duì)應(yīng)的子詞典

Vp={(w,v,wPOS)|w∈d,d∈Dp,v∈RM}
p=1,2,…,P

(5)

對(duì)字典V中的詞w,其SF權(quán)值定義如下:

(6)

(7)

下面將通過一個(gè)簡(jiǎn)單的例子說(shuō)明SF權(quán)值在緩解語(yǔ)料不均衡問題上的作用及效果.假設(shè)某行業(yè)由3個(gè)主體S1、S2、S3組成,詞w1、w2和w3是行業(yè)的三個(gè)重要特征.在不均衡的網(wǎng)絡(luò)評(píng)論語(yǔ)料中,主體S1有100條評(píng)論,且都包含w1;主體S2有10條評(píng)論,且都包含w1和w2;主體S3有90條評(píng)論,且都包含詞w1和w3.顯然,w1在整個(gè)行業(yè)中重要度最大,w2和w3的重要度相近且低于w1.由(2)式分別計(jì)算w1、w2和w3的TF權(quán)值為0.6667、0.0333、0.3000,可以看到,w2的權(quán)值僅是最大權(quán)值的1/20,在特征選擇中很容易被忽略.由(3)式得到w1、w2和w3的TFIDF權(quán)值分別為0、13.01、31.21,歸一化后為0、0.2942、0.7058,由于w1的權(quán)值為0,將導(dǎo)致最重要的特征被忽略.由(6)式計(jì)算w1、w2和w3的SF權(quán)值分別為1、1/3、1/3,歸一化得到0.6、0.2、0.2,可見w1的SF權(quán)值最大,w2和w3的權(quán)值相同且略小于w1,說(shuō)明SF權(quán)值能夠更為準(zhǔn)確地體現(xiàn)詞語(yǔ)在刻畫行業(yè)整體特征時(shí)的重要度.

2.3.2 基于SF-G指數(shù)的特征詞提取

服務(wù)質(zhì)量評(píng)價(jià)的目標(biāo)通常對(duì)應(yīng)于評(píng)論文本中的名詞,因此為了確定顧客對(duì)服務(wù)質(zhì)量的關(guān)注點(diǎn),進(jìn)一步確定服務(wù)質(zhì)量評(píng)價(jià)綜合指標(biāo),需要在語(yǔ)料詞典的名詞中進(jìn)行特征詞提取(3)為了簡(jiǎn)潔,本文將作為服務(wù)質(zhì)量評(píng)價(jià)目標(biāo)的特征名詞簡(jiǎn)稱為特征詞。.將由名詞構(gòu)成的詞典記為

VNoun={(w,v)|(w,v,wPOS=Noun)∈V}

(8)

文獻(xiàn)[12]將G指數(shù)[14]應(yīng)用于共詞分析的主題詞選取,提出詞頻G指數(shù)來(lái)確定高頻詞.文獻(xiàn)[15]將詞頻G指數(shù)進(jìn)行改進(jìn),解決了將多個(gè)具有相同頻次的詞語(yǔ)劃分為高頻或低頻詞的問題.借鑒上述工作,我們提出主體頻率G(SF-G)指數(shù)的特征詞選擇方法.將VNoun中的名詞按其SF權(quán)值從大到小進(jìn)行排序,定義前G個(gè)詞的累計(jì)主體頻率(Cumulative Subject Frequency,CSF)為

(9)

則劃分高低頻詞的SF-G指數(shù)的判別條件為

(10)

其中,P是主體總數(shù),n是與第G個(gè)詞wG具有相同SF的詞(包括wG)的個(gè)數(shù).由于

(n-1)fSF(wG)+fSF(wG+n)

(11)

因此,(10)式的判別條件可等價(jià)地表示為

(12)

也就是說(shuō),當(dāng)前G個(gè)詞的CSF值滿足不等式(12)時(shí),將選擇前G+n-1高頻詞作為特征詞,形成的特征詞集合記為

WNoun={(wi,vi)|(wi,vi)∈VNoun,i=1,2,…,G+n-1}

(13)

2.4 基于特征詞聚類的評(píng)價(jià)指標(biāo)提取

3 服務(wù)質(zhì)量評(píng)分模型

依據(jù)提取的服務(wù)質(zhì)量評(píng)價(jià)指標(biāo),為了對(duì)行業(yè)某個(gè)主體的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),需要進(jìn)一步構(gòu)建服務(wù)質(zhì)量評(píng)分模型,根據(jù)網(wǎng)絡(luò)評(píng)論語(yǔ)料計(jì)算得到顧客對(duì)主體服務(wù)質(zhì)量的滿意度分?jǐn)?shù).服務(wù)質(zhì)量評(píng)價(jià)目標(biāo)是由評(píng)論文本中的名詞確定,而顧客對(duì)主體服務(wù)質(zhì)量的感知?jiǎng)t由評(píng)論文本中的情感詞(形容詞及副詞)決定,根據(jù)情感詞的情感極性來(lái)判斷評(píng)論句的情感傾向,該內(nèi)容屬于NLP中情感分析的研究范疇.本文將直接利用已有的情感分析工具獲取評(píng)論句的情感極性得分,并以此為基礎(chǔ),結(jié)合第2節(jié)提取的服務(wù)質(zhì)量評(píng)價(jià)指標(biāo),設(shè)計(jì)服務(wù)質(zhì)量評(píng)分模型.評(píng)分模型的構(gòu)建過程需要解決以下幾個(gè)問題:1) 評(píng)論句分類;2) 評(píng)論句情感極性分析;3) 服務(wù)質(zhì)量評(píng)分計(jì)算.

3.1 評(píng)論句分類

依據(jù)中文書寫格式和習(xí)慣,首先以標(biāo)點(diǎn)符號(hào)或者空格為分割符號(hào),將所有評(píng)論分割成短評(píng)論句.然后,根據(jù)特征詞的聚類結(jié)果{W1,W2,…,WK},將評(píng)論句分派到服務(wù)質(zhì)量各級(jí)評(píng)價(jià)指標(biāo)相應(yīng)的類別.在擁有大量標(biāo)注語(yǔ)料的情況下,通常可以將已標(biāo)注類別的評(píng)論句作為樣本來(lái)訓(xùn)練分類器,再使用分類器對(duì)無(wú)標(biāo)注評(píng)論句進(jìn)行分類.然而,直接由網(wǎng)絡(luò)獲取的評(píng)論通常都是未標(biāo)注語(yǔ)料,因此本文使用基于評(píng)價(jià)指標(biāo)匹配的方法對(duì)評(píng)論句進(jìn)行分類.

(14)

(15)

其中,k=1,2,…,K;i=1,2,…,|Wk| 同樣,評(píng)論句dp可以屬于不同三級(jí)指標(biāo)對(duì)應(yīng)的類別.

3.2 評(píng)論句情感分析

本文直接使用中文NLP的SnowNLP庫(kù)中的情感分析工具包對(duì)分類后的評(píng)論句進(jìn)行情感分析,并給出情感分.SnowNLP的情感分析的基本模型是Bayes模型,利用SnowNLP訓(xùn)練的情感分類器可對(duì)評(píng)論句的情感極性進(jìn)行預(yù)測(cè).對(duì)某條評(píng)論句d,將其情感分記為z(d),z(d)∈(0,1).情感分值越大表示評(píng)論句的情感越傾向于積極的一面,說(shuō)明顧客滿意度越高;反之,顧客滿意度越低.

3.3 評(píng)分模型

對(duì)多個(gè)評(píng)價(jià)主體的評(píng)論句分別進(jìn)行各級(jí)分類后,可以利用評(píng)論句的情感分計(jì)算各級(jí)指標(biāo)的評(píng)分.并依據(jù)各評(píng)價(jià)主體的指標(biāo)評(píng)分進(jìn)一步對(duì)行業(yè)的各級(jí)服務(wù)質(zhì)量指標(biāo)進(jìn)行評(píng)價(jià),以及對(duì)各主體的顧客滿意度進(jìn)行排名.各級(jí)指標(biāo)的評(píng)分一般可通過對(duì)下級(jí)指標(biāo)得分取平均得到,然而當(dāng)各評(píng)價(jià)主體的評(píng)論句分布不均衡時(shí),將會(huì)導(dǎo)致僅具有少量評(píng)論句的主體的評(píng)分趨于極高或極低的極端情況,從而會(huì)引起各級(jí)指標(biāo)評(píng)分不準(zhǔn)確、以及各主體的顧客滿意度排名不合理的問題.一般來(lái)說(shuō),對(duì)主體或與主體評(píng)價(jià)指標(biāo)相關(guān)的評(píng)論數(shù)據(jù)越多,表示主體越受顧客歡迎,或者主體評(píng)價(jià)指標(biāo)受關(guān)注度越高;反之亦然.基于此,本文將采用加權(quán)平均的方法計(jì)算各級(jí)指標(biāo)的評(píng)分,同時(shí)在對(duì)不同評(píng)價(jià)主體的指標(biāo)評(píng)分計(jì)算中引入一種熱度指數(shù),以緩解數(shù)據(jù)不均衡產(chǎn)生的問題.

3.3.1 行業(yè)指標(biāo)評(píng)分

(16)

(17)

其中,k=1,2,…,K;i=1,2,…,|Wk|.

(18)

(19)

3.3.2 評(píng)價(jià)主體指標(biāo)評(píng)分

(20)

(21)

(22)

(23)

(24)

類似地,Sp的一級(jí)指標(biāo)T(1)的評(píng)分定義為二級(jí)指標(biāo)評(píng)分的熱度加權(quán)平均,即

(25)

(26)

(27)

(28)

4 不均衡網(wǎng)絡(luò)評(píng)論下的酒店服務(wù)質(zhì)量評(píng)價(jià)

4.1 語(yǔ)料概況

本文使用爬蟲技術(shù)收集“貓途鷹”網(wǎng)站上中國(guó)所有省、直轄市、自治區(qū)(包括港澳臺(tái)地區(qū))的五星級(jí)酒店的中文評(píng)論,共涉及438個(gè)五星級(jí)酒店,其中最早的評(píng)論來(lái)自2006年2月,最新的評(píng)論來(lái)自2019年10月.評(píng)論數(shù)據(jù)統(tǒng)計(jì)見表1.從表中可以看到,最大酒店評(píng)論數(shù)與最小酒店評(píng)論數(shù)的極差為8943,并且語(yǔ)料的標(biāo)準(zhǔn)差達(dá)到1037.41,說(shuō)明語(yǔ)料中各酒店評(píng)論數(shù)據(jù)的分布極不均衡.如:

表1 酒店評(píng)論數(shù)據(jù)統(tǒng)計(jì)Table 1 Data statistics of hotel reviews

4.2 實(shí)驗(yàn)環(huán)境工具

實(shí)驗(yàn)運(yùn)行在CPU型號(hào)為i5-4210M,內(nèi)存為8 GB,操作系統(tǒng)為Windows 10 專業(yè)版 64位的筆記本電腦上.實(shí)驗(yàn)涉及的所有程序代碼均采用python3.6.5實(shí)現(xiàn),并在Spyder3下進(jìn)行編譯與運(yùn)行.程序中主要使用的軟件包及相應(yīng)版本如下:機(jī)器學(xué)習(xí)包scikit-learn(0.22.1),數(shù)值運(yùn)算包numpy(1.18.1),詞向量訓(xùn)練工具包gensim(3.8.2),中文情感處理包SnowNLP(0.12.3)以及中文分詞工具包jieba(0.42.1).

4.3 特征詞提取

為發(fā)現(xiàn)顧客對(duì)酒店服務(wù)的關(guān)注情況,首先對(duì)上述語(yǔ)料數(shù)據(jù)進(jìn)行分詞并標(biāo)注詞性,將詞語(yǔ)分為名詞、動(dòng)詞、形容詞、其他等四類,其分布情況如表2所示.酒店服務(wù)質(zhì)量評(píng)價(jià)的目標(biāo)一般為評(píng)論文本中的名詞,本文從名詞中提取特征詞作為酒店服務(wù)特征.

表2 詞性分布Table 2 Part of speech

圖2 給出評(píng)論名詞的SF、TF和TFIDF三種權(quán)值梯度的變化趨勢(shì)圖,其橫坐標(biāo)按權(quán)值大小排序.可以看出TF和TFIDF兩種權(quán)值在不平衡數(shù)據(jù)下會(huì)出現(xiàn)數(shù)值突變的情況,如果以突變點(diǎn)作為特征詞權(quán)值分界點(diǎn),則特征詞數(shù)目過少,無(wú)法完整反映酒店特征;而SF權(quán)值變化更為平緩,能夠更全面地表示酒店特征,因此基于SF權(quán)值提取特征詞應(yīng)更為合理.

圖2 權(quán)值梯度變化圖Fig.2 Changes of weights gradient

評(píng)論名詞的SF權(quán)值由(6)-(7)式計(jì)算,并采用本文提出的SF-G指數(shù)提取特征詞.由(12)式計(jì)算可提取365個(gè)特征詞,其中高頻詞與低頻詞的臨界主體頻數(shù)fSF·P=281.特征詞的分布如表3所示,表中括號(hào)內(nèi)的數(shù)字表示其序號(hào),詞語(yǔ)下面的數(shù)字為其主體頻數(shù)(fSF·P).

表3 酒店評(píng)論特征詞Table 3 Feature nouns of hotel reviews

4.4 酒店服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系構(gòu)建

根據(jù)特征名詞構(gòu)建服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系,其中以服務(wù)質(zhì)量為一級(jí)指標(biāo),所有的特征名詞為三級(jí)指標(biāo),二級(jí)指標(biāo)通過對(duì)三級(jí)指標(biāo)聚類得到.為了確定最佳的二級(jí)指標(biāo)數(shù)目,采用k-means聚類算法,根據(jù)歐式距離對(duì)特征名詞的詞向量進(jìn)行聚類.不斷調(diào)整聚類簇目K的值,重復(fù)多次實(shí)驗(yàn),依據(jù)Calinski-Harabaz聚類指標(biāo)和專家決策共同決定最佳聚類簇目數(shù)為K=4,其Calinski-Harabaz值為27.23.由此,根據(jù)特征名詞所屬簇類可設(shè)置4個(gè)二級(jí)指標(biāo),分別為餐飲服務(wù),住宿條件,住宿服務(wù),周圍環(huán)境.每個(gè)二級(jí)指標(biāo)下有若干個(gè)不同的三級(jí)指標(biāo).然后,由(16)-(19)式計(jì)算得到五星級(jí)酒店整體行業(yè)的指標(biāo)評(píng)分.各級(jí)指標(biāo)名稱含義和評(píng)分見表4.

表4 服務(wù)質(zhì)量評(píng)分Table 4 Service quality score

表5給出由本文方法和幾個(gè)傳統(tǒng)方法[17,18,20]得到的酒店評(píng)價(jià)指標(biāo)模型的對(duì)比結(jié)果.其中文獻(xiàn)[17]的數(shù)據(jù)由傳統(tǒng)的問卷調(diào)查得到,并采用三重計(jì)量模型對(duì)評(píng)價(jià)指標(biāo)進(jìn)行人工提取;文獻(xiàn)[18]和文獻(xiàn)[19]分別采用內(nèi)容分析法和變量分析法從網(wǎng)絡(luò)評(píng)論數(shù)據(jù)中人工提取評(píng)價(jià)指標(biāo);本文則采用人工智能方法通過對(duì)網(wǎng)絡(luò)評(píng)論數(shù)據(jù)的挖掘自動(dòng)提取評(píng)價(jià)指標(biāo).可以看出,服務(wù)評(píng)價(jià)指標(biāo)體系構(gòu)建的數(shù)據(jù)來(lái)源已逐漸從問卷調(diào)查轉(zhuǎn)向網(wǎng)絡(luò)評(píng)論,而傳統(tǒng)方法主要依靠專家經(jīng)驗(yàn)對(duì)指標(biāo)進(jìn)行人工提煉.人工提取的酒店服務(wù)質(zhì)量指標(biāo)主要為酒店的位置、設(shè)施、客房和員工等方面及其總體評(píng)價(jià),本文提取的評(píng)價(jià)指標(biāo)與之相似.相比之下,本文采用數(shù)據(jù)挖掘方法能夠以較小的人工成本有效地構(gòu)建評(píng)價(jià)指標(biāo)模型.

表5 酒店服務(wù)評(píng)價(jià)指標(biāo)模型Table 5 Hotel service evaluation index model

4.5 酒店服務(wù)質(zhì)量評(píng)分及排名

(29)

第p個(gè)酒店Sp的一級(jí)指標(biāo)T(1)的顧客滿意度排名評(píng)分,即服務(wù)質(zhì)量綜合評(píng)分,換算公式為

(30)

圖3展示了熱度指數(shù)加權(quán)后綜合評(píng)分為前10的酒店評(píng)分排名情況.從圖中可以看出香格里拉大酒店綜合評(píng)分最高,且遠(yuǎn)高于其他酒店;在綜合評(píng)分前十的酒店中香格里拉品牌酒店占據(jù)7席,除此之外只有中國(guó)大飯店、中茵皇冠假日酒店和北京嘉里大酒店三個(gè)酒店排名在前10.

圖3 五星級(jí)酒店評(píng)分排名(綜合排名前10)Fig.3 Five-star hotels rating ranking (overall rank top 10)

表6給出熱度指數(shù)加權(quán)方法對(duì)數(shù)據(jù)不均衡問題的性能分析.以排名第1的香格里拉大酒店和僅包含少量評(píng)論數(shù)據(jù)的1881公館、香港瑰麗酒店和日月行館國(guó)際溫泉觀光酒店為例,對(duì)其各二級(jí)指標(biāo)的熱度指數(shù)加權(quán)評(píng)分和未進(jìn)行熱度指數(shù)加權(quán)的評(píng)分排名進(jìn)行對(duì)比,其中排名后帶有字母(H)的表示熱度指數(shù)加權(quán)后的評(píng)分排名,未帶(H)的表示未進(jìn)行熱度指數(shù)加權(quán)的評(píng)分排名.可以看到,如果不進(jìn)行熱度指數(shù)加權(quán)評(píng)分,僅有少量評(píng)論的酒店其評(píng)分排名都很靠前,若以此作為最終評(píng)分進(jìn)行排名顯然很不合理.評(píng)論數(shù)目的多少可以反映顧客對(duì)酒店的關(guān)注程度,因此將顧客對(duì)酒店的偏好加入評(píng)分計(jì)算更為合理.本文定義的熱度指數(shù)權(quán)值可以通過評(píng)論的數(shù)量來(lái)表示顧客的偏好.表6中1881公館等酒店經(jīng)熱度指數(shù)加權(quán)后的評(píng)分排名明顯低于未經(jīng)熱度指數(shù)加權(quán)的評(píng)分排名,并且香格里拉大酒店的熱度指數(shù)加權(quán)評(píng)分位于第1名,說(shuō)明熱度指數(shù)加權(quán)能夠有效地緩解數(shù)據(jù)不均衡導(dǎo)致的評(píng)分排名計(jì)算偏差和評(píng)價(jià)失真問題.

表6 酒店評(píng)分排名Table 6 Hotel rating

5 結(jié) 論

本文通過主體頻率、主體頻率G指數(shù)和熱度加權(quán)等方法,構(gòu)建的酒店服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系,有效緩解了由于數(shù)據(jù)不均衡帶來(lái)的評(píng)價(jià)結(jié)果失真的問題,增加了評(píng)價(jià)結(jié)果的客觀性和評(píng)價(jià)方法的快捷性.將該模型應(yīng)用在中國(guó)五星級(jí)酒店服務(wù)質(zhì)量評(píng)價(jià)上,發(fā)現(xiàn)對(duì)旅客滿意度影響最大的是酒店的餐飲服務(wù)、住宿條件、住宿服務(wù)、周邊環(huán)境等四個(gè)指標(biāo).在計(jì)算酒店的綜合評(píng)分并進(jìn)行排名中發(fā)現(xiàn)排名前10的酒店只有三家不屬于香格里拉品牌,說(shuō)明品牌酒店保證了服務(wù)質(zhì)量水平的一致性.該評(píng)價(jià)模型也可以推廣到其他行業(yè)的服務(wù)質(zhì)量評(píng)價(jià).

猜你喜歡
主體評(píng)價(jià)
SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
石油瀝青(2021年4期)2021-10-14 08:50:44
論自然人破產(chǎn)法的適用主體
從“我”到“仲肯”——阿來(lái)小說(shuō)中敘述主體的轉(zhuǎn)變
中藥治療室性早搏系統(tǒng)評(píng)價(jià)再評(píng)價(jià)
技術(shù)創(chuàng)新體系的5個(gè)主體
懷舊風(fēng)勁吹,80、90后成懷舊消費(fèi)主體
金色年華(2016年13期)2016-02-28 01:43:27
基于Moodle的學(xué)習(xí)評(píng)價(jià)
關(guān)于項(xiàng)目后評(píng)價(jià)中“專項(xiàng)”后評(píng)價(jià)的探討
論多元主體的生成
保加利亞轉(zhuǎn)軌20年評(píng)價(jià)
主站蜘蛛池模板: 青青草91视频| 无码精品国产VA在线观看DVD| 九九精品在线观看| 亚洲无码高清免费视频亚洲 | 91亚洲视频下载| 国产欧美精品一区二区| 国产伦精品一区二区三区视频优播| 亚洲精品无码在线播放网站| www.91中文字幕| 午夜国产大片免费观看| 毛片基地美国正在播放亚洲| 国产sm重味一区二区三区| 国产成人精品三级| 国产00高中生在线播放| 久久国产亚洲偷自| 国产精品原创不卡在线| 99久久精品免费看国产免费软件| 91网址在线播放| 日韩欧美一区在线观看| 久久久久国产精品熟女影院| 亚洲精品片911| 毛片在线播放网址| 热伊人99re久久精品最新地| 国产美女一级毛片| 动漫精品啪啪一区二区三区| 日韩无码黄色| 欧美综合在线观看| 日韩性网站| 国产精品v欧美| 国产农村妇女精品一二区| 国产91在线|中文| 97人人模人人爽人人喊小说| 日韩123欧美字幕| 国产精品综合色区在线观看| 国产成人精品视频一区视频二区| 欧美亚洲国产日韩电影在线| 欧美精品1区| 在线欧美一区| 亚洲无码久久久久| 免费jizz在线播放| 2021国产v亚洲v天堂无码| 国产传媒一区二区三区四区五区| 日韩亚洲综合在线| 欧美精品综合视频一区二区| 色播五月婷婷| 最新日韩AV网址在线观看| a在线亚洲男人的天堂试看| 欧美专区在线观看| 色亚洲成人| 亚洲欧美日韩中文字幕在线| 国内精品久久人妻无码大片高| 国产在线八区| 国产人成午夜免费看| 亚洲成人手机在线| 欧美日韩导航| 精品无码一区二区在线观看| 992tv国产人成在线观看| 久久这里只有精品2| 第一页亚洲| 毛片在线看网站| 91无码视频在线观看| 大香伊人久久| 精品国产一区二区三区在线观看| 青青久视频| 欧美不卡视频在线| 91美女视频在线| 青青草91视频| 欧美国产综合色视频| 国产丝袜一区二区三区视频免下载| www.精品国产| 国产一在线| 一级毛片免费高清视频| 亚洲国产午夜精华无码福利| 精品福利视频导航| 欧美天天干| 国产91丝袜在线播放动漫 | 日本成人在线不卡视频| 在线视频亚洲欧美| 免费在线看黄网址| 51国产偷自视频区视频手机观看| 欧美一区二区啪啪| 午夜a级毛片|