999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊綜合評價的美團評論數據情感分析

2020-07-26 14:23:53閆賀白璐璐張曉如張再躍
軟件導刊 2020年7期
關鍵詞:情感評價模型

閆賀 白璐璐 張曉如 張再躍

摘 要:美團平臺上店鋪的評分是一個綜合性評分,并不能從多個角度說明店鋪情況,客戶根據綜合評分很難選擇到符合自己需求的店鋪。現有評價模型在商品屬性選擇和權重上依靠有經驗的管理者給出,存在很大的主觀性。針對這些問題,提出了基于模糊綜合評價的情感分析模型。該模型首先采用關鍵詞提取與模糊矩陣相結合方法,對評論的語料進行關鍵詞提取,然后根據關鍵詞權重設置模糊矩陣,最后將評論情感分析結果放在模糊矩陣中,構建出基于模糊矩陣的綜合情感評價模型。在美團評論數據集上進行實驗,結果是綜合評價分與美團平臺的綜合性評分只相差0.02%,說明該模型結果非常準確。模型給出了店鋪除綜合評分以外的其它關鍵詞得分,全面分析了店鋪的口味、環境、價格等因素評分,為顧客選擇提供了多角度指導。所得出的評分也給商家提供了很好的指導意見,以幫助商家調整經營模式和策略。

關鍵詞:情感分析; 模糊矩陣;情感傾向;美團平臺

DOI:10. 11907/rjdk. 192234 開放科學(資源服務)標識碼(OSID):

中圖分類號:TP301文獻標識碼:A 文章編號:1672-7800(2020)007-0019-05

Emotional Analysis of Meituan Review Data

Based on Fuzzy Comprehensive Evaluation

YAN He1, BAI Lu-lu2, ZHANG Xiao-ru1, ZHANG Zai-yue1

(1. School of Computer Science, Jiangsu University of Science and Technology, Zhenjiang 212003, China;

2. School of Computer Science and Information Security, Guilin University of Electronic Technology, Guilin 541004, China)

Abstract:The ratings of the stores on the Meituan platform are comprehensive, and it is impossible to explain the situation of the stores from multiple angles. It is difficult for customers to select a store that meets their needs according to the comprehensive score. The commodity attributes and weights of the evaluation model are given by experienced managing statt. This evaluation model is very subjective. Aiming at these problems, this paper proposes a sentiment analysis model based on fuzzy comprehensive evaluation. First, the model adopts the method of combining keyword extraction and fuzzy matrix, extracts the keywords from the corpus of comments, and then sets the fuzzy matrix according to the weight of the keywords. Finally, the results of the comment sentiment analysis are placed in the fuzzy matrix to construct fuzzy comprehensive emotion evaluation model based on fuzzy matrix. The comprehensive evaluation results obtained by the experiment on the Meituan review dataset differed only 0.02% from the comprehensive score of the Meituan platform, indicating that the results obtained by the model are extremely accurate. The model gives the scores of other keywords in addition to the comprehensive scores of the stores, comprehensively analyzes the scores of the stores taste, environment, price and other factors, providing customers with a multi-angle selection guide; the resulting scores also provide good guidance to merchants to help them adjust their business models and strategies.

Key Words: sentiment analysis; fuzzy matrix; sentiment orientation; Meituan platform

0 引言

人們在美團選購商品時往往會參考美團提供的店鋪和商品評價系統。市場調查結果顯示,約有81%的用戶會在購買商品之前觀看商品的相關評論,其中80%的顧客會認為這些評論影響到自己的購買行為,由此可見,對商品進行較為詳細和深入的多角度情感分析,是滿足用戶和市場需求的重要環節,同時商家也可根據客戶評論,對自己的經營模式和策略作出相應調整,更好地滿足客戶需求,在激烈的市場角逐中贏得商機。隨著經濟的發展,人們的商品質量觀已從僅考慮商品內在與個性質量,發展到越來越注重商品的外觀質量、社會質量、經濟質量和市場質量等綜合因素[1]。正是因為這種觀念的轉變,對商品評估提出了新的要求,多角度全面深入評價成為趨勢。

封麗[2]利用情感詞典結合情感分析的方法對微博文本的輿論內容進行情感分析,從而比較迅速、實時表現出隨著時間變化的輿情狀況;李耀林[3]通過一系列的情感分析算法,處理了筆記本電腦的評論信息,得到用戶對筆記本電腦的情感傾向,從而判斷不同電腦產品的受歡迎程度;Zhao等[4]使用表情符號的情感分析,開發了一款基于表情流的微博情感實時檢測系統;楊靜[5]對于商品評價環節存在的問題,引入了模糊數學綜合評價方法,該方法表現出較好的易懂性和公平性。

本文結合情感分析和模糊綜合評價方法,對美團的評論數據進行分析研究,從顧客關心的多個因素給出評價。該模型首先對獲取的評論數據進行清洗,然后提取評論數據關鍵字,計算評論因素集合和因素集權重,最后通過對評論的情感分析構建模糊綜合評價矩陣,通過模糊綜合評價矩陣獲得一個綜合評價結果,獲得每個因素對應的評價得分。

1 相關概念

本文提出的基于模糊矩陣的情感分析模型不僅涉及到因素集、評語集、權重集、分數集等基本概念,還涉及到數據清洗規則。模糊綜合評價方法最原始的雛形是模糊集合,該集合由美國的控制論專家L.A.Zadch教授于1965年提出 [6]。模糊綜合評價法是以模糊數學、模糊線性變換原理和最大隸屬度原則為基礎,考慮所需評價事物的各個評價指標因素對事物做出的綜合評價。

1.1 因素集與評語集

因素集通常是對商品屬性、特征的描述。在模糊綜合評價模型中,針對商品的因素用[U]表示。[U={key1,key2,][?,keyn}],其中[keyn]表示第[n]個評價因素。評語集是每個評價因素的評語集合,用[V={v1,v2,?,vn}]表示,其中[vn]表示對商品特征[keyn]的評語。

以蘋果評價為例,其屬性或特征有品相、大小、甜度等幾個指標,其因素集可表示為 {品相,大小,甜度}。假定用戶對每個屬性(因素)的評價結果分為好、中等、差3個級別,那么 {好、中等、差}可視為該蘋果的一個評語集。

1.2 權重向量

權重指模糊綜合評價因素集中每個因素的權重,每個因素權重的選取直接影響評價結果的準確性,通常由調查對象根據各自的知識、經驗以及偏好因素直接給出其認為合適的數值作為模型的權重。這種做法雖然簡單明了,但是有一個明顯的缺點,就是存在很大的主觀性[7-9]。

本文提出的模型權重是由大量數據計算分析得到的,擁有數學理論基礎,很大程度上規避了人為賦權帶來的缺點。令[n]個評價因素的權重向量為[A]

式(1)中,[an]表示因素集中第[n]個元素對應的權重值。

1.3 模糊評價模型

模糊評價模型,是一種運用模糊數學原理分析和評價具有“模糊性”系統的方法。這種方法在處理各種難以用精確數學方法描述的復雜系統問題時表現出獨特的優越性,在評價方面應用很廣泛。

模糊評價模型結構如圖1所示。首先根據顧客的評論構建評價指標體系,得出因素集模塊;然后由相關有經驗的管理者結合評論給出權重矩陣模塊;最后通過二者計算的結果確定評價矩陣[5]。

圖1所展示的模糊評價模型存在兩點不足:①其因素集是依據其各自情況選定和調整的,不能很好地反映顧客在評論中真正關注的商品屬性;②權重矩陣是管理者依據自身經驗給出,存在很大主觀性。這是當前評價模型的共性問題。

2 模糊綜合情感評價模型

目前評論分析大多停留在情感分析階段,根據得到的大量情感分析結果,對所評論的主題作出主觀判斷[10-12]。隨著生活質量的提高,人們對于事物的評價不再停留在一個維度上,一個綜合的評價結果才能說明一個事物好壞。鑒于此,本文結合模糊矩陣,提出模糊綜合情感評價模型。

2.1 數據清洗

對數據進行過濾,去掉一些重復和不必要的數據[13]即為數據清洗。對綜合評價來說,一組高質量的數據直接影響到結果的準確性。為得到可靠的數據需對獲取的數據進行清洗[14]。清洗規則如下:

(1)刪除評論數據為空的數據。空數據對于評論分析沒有任何意義,但是在最后的綜合性分析中會影響最終的綜合性評價結果。為了保證最終結果的準確性,要對空數據進行刪除。

(2)刪除虛假數據。在美團評論系統中,越是評分高的店鋪被推薦的概率越大。所以,某些商戶為了利益最大化,存在虛假刷單的不誠信行為。在眾多評論數據中就存在一些虛假和冗余的數據。只有刪除虛假數據才能保證評分結果的公平性。

刪除虛假數據的方法:1遍歷所有的評論數據,刪除評論相同的數據;2設置一定的時間間隔,刪除同一時間間隔內同一用戶的多條評論數據。

2.2 關鍵字概率與權重計算

模糊綜合情感評價模型因素集是從10幾萬條評論中提取的高頻率關鍵字集合。假設每條評論語句提取[n]個關鍵字,一共有[K]條評論數據,令[A]表示所有評論可以提取出的關鍵字總和[15],即:

將獲取的所有關鍵字進行整理,重復的關鍵字進行合并,則可以得到關鍵字[KEY]的集合。[KEY={key1,key2,][?,keyn}],其中[keyn]表示第[n]個關鍵字,[KEY]集合中第[q]([qn])個關鍵字出現的概率[P(keyq)]計算公式如下:

式(3)中,[N(keyq)]表示第[q]個關鍵字的出現次數。本文提出的模型選取概率比較大,將能夠體現因素集特征的關鍵字作為評價指標。

式(4)就是將[n]個評價因素的概率進行歸一化處理,由此得到[n]個評價因素的權重向量為[A]。

2.3 評論語句的情感傾向分析

模糊評價矩陣的構建離不開評論語句的情感分析,情感傾向分析是利用一定的方法判斷一個評論的情感傾向。使用情感詞典對評論語句中的語氣詞、程度副詞等打分,得出評論語句的情感傾向值[16-18],步驟如下:①找到每條評論的情感詞,按照情感詞正負打分,正面情感評分加一,負面情感評分減一;②定位情感詞位置,搜索附近的程度副詞:不同類程度副詞為權重乘以情感詞基礎得分;遇到否定詞反轉詞,計算個數,奇數取基礎分的相反數,偶數不變;③對每條評論計算正、負情感得分:若正得分減去負得分大于零則為正向情感;若正得分減去負得分為零則為中等;若正得分減去負得分小于零則為負面情感。

2.4 模型構建

模糊綜合情感評價模型如下:

其中,[U]表示因素集,[V]表示評語集,[C]表示評價結果統計矩陣,[A]表示權重向量,[B]表示綜合評價結果矩陣。

計算得出因素集[U]。評價過程是將每條評論與因素集中的關鍵字進行匹配。如果匹配成功則記錄對應評論語句的情感值,根據情感值大小得到相應的評語從而得到評語集[V]。對獲得的評語結果個數進行統計,得到評價結果統計矩陣[C]。

式(5)中,[cmn]表示評價為[vn],關鍵字為[keym]的評論語句個數。

對于單個因素[Ui][(i=1,?,m)]進行評判,得[V]上的[F]集[{ri1,ri1,?,rim}],所以它是從[U]到[V]的一個映射。

映射[f]可以確定一個[F]的關系[R∈μm×n],則模糊評價矩陣[R]可表示為:

式(8)中,[rij]由公式(9)計算得出:

綜合評價結果[B]由權重向量[A]與模糊矩陣[R]相乘得到:

式(10)中,[bn]代表第[n]個評語的值。

由上述公式求得模型包含的關鍵變量,從而構建出基于模糊矩陣的模糊綜合情感評價模型。

2.4 數據處理流程

針對模糊綜合評價模型不足本文做了改進。對美團海量評論數據進行關鍵字提取,選取評論中出現最多的關鍵字作為商品屬性,構建真實反映顧客對商品關注點的因素集;權重矩陣完全按照概率統計得到的數據進行賦值,對評論中關注點最高的屬性賦予最大值,所有賦值經過歸一化處理。

模型構建流程如圖2所示。

首先對在美團上爬取到的數據按照數據清洗規則進行清洗,然后對清洗過的評論數據進行關鍵字提取和情感傾向分析,用關鍵字提取結果計算出模糊矩陣權重,情感傾向分析結果用來構建模糊評價矩陣,最后計算出模糊綜合評價結果。

3 實驗與結果分析

3.1 實驗數據與環境

在Win10系統下,使用Mysql數據庫,采用Python爬蟲框架[19-20],對美團上的餐飲評論數據進行爬取。本實驗爬取某連鎖餐飲品牌的評論數據,一共有111 493條。評分是用戶按照自己的意愿給出的分數,滿分是50分。實驗根據兩個數據清洗規則對數據進行預處理,首先將空白評論的數據刪除,然后刪除虛假數據。經過清洗后,剩余數據一共有105 000條。

3.2 實驗過程

使用NLPIR-ICTCLAS漢語分詞系統輸入評論數據,根據式(2)、式(3)得到最大概率的13個關鍵詞,即因素集U={味道,口味,環境,服務,態度,位置,排隊,時間,價格,套餐,老板,覺得,口感},再根據式(4)對評價指標的概率值進行歸一化處理,得到各個評價指標重要程度的描述,即得到式(1)的權重向量[A]。各個評價因素的權重如表1所示。

從表1可以看出,權重比較大的是“味道”和“口味”兩個因素,說明大多數的顧客對菜品的口味比較注重。作為一個商家來說,著重關注自己菜品的味道可提高顧客的滿意度。

情感傾向分析使用百度AI的情感分析方法[20-22],negative_prob表示感情消極概率,positive_prob表示感情積極概率。根據輸入輸出規范,得出每條評論的情感得分,如表2所示。

由情感得分表得出評論情感傾向的概率,將評價結果分為“很積極” “積極” “態度溫和” “消極” “很消極”5個級別,即評語集V={很積極,積極,態度溫和,消極,很消極}。整理情感分析結果,得到評論情感傾向的數目統計表,由表3構建式(5)的矩陣[C],再根據公式(9)得出模糊矩陣[R]。

最后由式(10)得出綜合評價結果[B]

3.3 結果分析

將“積極”與“很積極”兩個結果之和表示為趨向正向的結果,則趨向正向的結果值為0.84%。根據獲取的美團數據,得到店鋪趨向正向的平均評分為41分,總分為50分,換算成比例趨向正向結果的值為0.82%。模糊綜合評價結果與美團數據的結果僅僅相差0.02%,說明通過模糊綜合評價法得到的結果與美團平臺的評分結果高度一致,驗證了模型的可靠性。模糊綜合評價體系不僅得出了總體的評價結果,而且從“口味”“位置”“價格”等多個角度對商品進行評價,得出的結果為顧客提供了更精準的選擇指導。同時商家也可從模型的詳細評分中得到啟發,改善經營模式,在激烈的市場競爭中搶奪先機。

4 結語

針對現有評價模型的不足之處,本文提出基于模糊矩陣的情感分析模型,并給出模型的形式化描述。模型在美團海量評論數據中進行關鍵詞提取,確定的因素集很好地反映出顧客的真實關注點,應用概率統計的知識構建權重矩陣,避免了人為賦值造成的主觀影響。

在美團評論數據集上的實驗證明了模型的有效性。根據模型的分析結果,不僅能得出顧客對商家的綜合性評價結果,還能得到店鋪口味、價格等不同屬性的評分,滿足不同顧客對同屬性評分的需求,一定程度上幫助顧客更精準地選擇合適的商家,也為商家調整經營模式,改變經營策略提供了數據參考。

參考文獻:

[1] 李衛忠. 商品質量的綜合評價體系及方法研究[J]. 價值工程,2006(9):67-70.

[2] 封麗. 面向微博短文本的情感分析和特征抽取[J]. 農業圖書情報學刊,2018(9):56-60.

[3] 李耀林. 面向評價對象的商品評論情感傾向性分析研究[D]. 杭州:浙江工商大學,2013.

[4] ZHAO J,DONG L,WU J, et al. Moodlens: an emoticon-based sentiment analysis system for chinese tweets[C].? knowledge discovery and data mining, 2012: 1528-1531.

[5] 楊靜. 電子商務網站商品模糊評價模型的構建[J]. 現代情報,2013,33(4):31-33.

[6] 王雪,時偉,胡瑞庚,柏進財. 基于模糊矩陣的鋼結構質量量化評價方法的研究[J]. 青島理工大學學報,2018,39(5):24-29.

[7] 孫禮娜,劉先蓓. 基于熵值法賦權的縣域開放水平模糊綜合評價[J]. 遼寧工業大學學報(自然科學版),2019,39(4):273-276.

[8] 王雙,李志平,辛倩,等. 模糊綜合評價法的整體安全評估[J]. 現代電子技術,2019,42(11):82-86.

[9] 許謙. 確定模糊評價綜合因素權重的一個方法[J]. 大學數學,2005(1):99-103.

[10] 冀乃彬.? 基于美團點評拼團項目的前端優化實踐[D]. 南京:南京大學,2018.

[11] 李蕙蕙,張韻,鄒慧,等. 基于美團大數據的武漢地區火鍋餐飲經濟分析[J]. 技術與市場,2017,24(10):214-216.

[12] 丁俊飛. 基于競爭情報的O2O模式企業競爭力評價體系研究[D]. 合肥:安徽大學,2017.

[13] 陳曉玲,褚漢,許鈞儒. 基于情感分析的商品評價模型構建研究[J]. 銅陵學院學報,2018(6):10-12.

[14] BIRAJ DAHAL,SATHISH A? P KUMAR, LI Z L. Topic modeling and sentiment analysis of global climate change tweets[J].? Social Network Analysis and Mining,2019,9(1):157-168.

[15] LIU D J, ZHOU W G, HE S J. Risk Assessment for urban gas transmission and distribution system using fuzzy comprehensive evaluation method[J]. Journal of Pipeline Systems Engineering and Practice,2018,9(1):914-919.

[16] 張洪玲, 張琦.? SaaS軟件質量分層模糊綜合評價方法研究[J].? 軟件導刊,2015(3):1-3.

[17] YANG Y,SONG Y. Research on the performance assessment of teaching cloud platform based on fuzzy comprehensive evaluation[J]. Journal of Physics: Conference Series,2019,1213(4):1081-1112.

[18] MARIN A,MOMTAZ J,RUBAIYA K,et al. Risk assessment based on fuzzy synthetic evaluation method [J]. The Science of the total environment,2019(658):520-531.

[19] HOGENBOOM A,BAL D,FRASINCAR F,et al. Exploiting emoticons in sentiment analysis[C]. ACM symposium on applied computing, 2013: 703-710.

[20] 盧竹兵,李玉州. 基于網絡評論情感信任分析的推薦策略[J]. 計算機科學,2019,46(6):75-79.

(責任編輯:杜能鋼)

猜你喜歡
情感評價模型
一半模型
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
如何在情感中自我成長,保持獨立
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
3D打印中的模型分割與打包
基于Moodle的學習評價
主站蜘蛛池模板: 亚洲精品第一在线观看视频| 97影院午夜在线观看视频| 国产精品永久不卡免费视频| 国产精品手机视频一区二区| jizz国产视频| 国产成人三级| 国产精品99一区不卡| 亚洲AV无码精品无码久久蜜桃| 国产v欧美v日韩v综合精品| 久久黄色影院| 精品91视频| 97国产精品视频自在拍| 制服丝袜一区| 国产一区二区三区在线精品专区 | 欧美日本不卡| 欧美综合区自拍亚洲综合天堂| 精品黑人一区二区三区| 九九视频免费在线观看| 91娇喘视频| 精品免费在线视频| 色综合天天综合| www.91在线播放| 青青青国产在线播放| AV不卡无码免费一区二区三区| 极品国产一区二区三区| 国产成人精品日本亚洲77美色| 成人免费午间影院在线观看| 国产小视频网站| 久久精品国产在热久久2019| 久无码久无码av无码| 在线免费亚洲无码视频| 中文字幕调教一区二区视频| 亚洲人成电影在线播放| 四虎永久在线| 久无码久无码av无码| 欧美日韩国产在线播放| 亚洲三级网站| 国产欧美在线观看一区 | 国国产a国产片免费麻豆| 国产亚洲视频在线观看| 欧美α片免费观看| 国产欧美成人不卡视频| 欧美国产日韩在线| 永久成人无码激情视频免费| 国产真实二区一区在线亚洲| 999国产精品永久免费视频精品久久| 日韩欧美国产精品| 99精品国产自在现线观看| 麻豆a级片| 98精品全国免费观看视频| 国模视频一区二区| 欧美精品另类| 久久99蜜桃精品久久久久小说| 99精品国产电影| 日本AⅤ精品一区二区三区日| 九色免费视频| 四虎永久在线精品影院| 欧美区一区| 久久无码免费束人妻| 91精品啪在线观看国产60岁| 国产亚洲欧美在线中文bt天堂 | 免费一级毛片不卡在线播放| 国产啪在线| 国产第一页亚洲| 91精品国产无线乱码在线| 国产一区二区三区免费观看| 国产精品专区第一页在线观看| 波多野结衣一区二区三区88| 亚洲精品成人片在线播放| 日韩欧美中文| 久久久久亚洲精品成人网 | 欧美日韩精品在线播放| 色悠久久久久久久综合网伊人| 久久99国产视频| 成人va亚洲va欧美天堂| 国产成人一区| 人妻丰满熟妇av五码区| 国产精品一区在线麻豆| 午夜影院a级片| 婷婷色婷婷| 99无码中文字幕视频| 伊人久久影视|