999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于美團在線評論的付費自習室評價研究

2022-05-21 04:24:42劉銀婷李秋敏詹潔
商展經濟 2022年10期
關鍵詞:語義詞匯消費者

劉銀婷 李秋敏 詹潔

(成都信息工程大學 四川成都 610103)

隨著社會就業壓力的提高,終身學習的意識深入人心,付費自習室是共享經濟發展下的產物,有自習需求的人們在家或多或少會被干擾。公共圖書館座位有限,咖啡館相對嘈雜,所以付費自習室逐漸變成了合適的選擇,商家通過構建沉浸式學習格子間并提供相應的學習條件和學習氛圍,消費者依據使用時間付費來獲得自習室座位的使用權。目前,國內學者對付費自習室的研究多集中在付費自習室的發展歷程、興起原因、用戶滿意的影響因素和未來發展,在研究方法上多為對問卷調查結果的簡單描述統計,未建立模型構建指標深入探討,基于線上評論信息挖掘分析的研究較少,本文意在借鑒其他學者的研究方法;首先,通過收集美團平臺中付費自習室的在線評論文本,對評論數據進行機械壓縮去詞、分詞、過濾停用詞等初步處理;然后,對文本進行情感傾向分類和語義網絡分析,分別建立正面、負面評價的詞頻聯系;最后,通過主題模型提取潛在主題,得到消費者對付費自習室的滿意點與抱怨點并對付費自習室的發展提出建議。

1 數據來源與預處理

1.1 數據來源

由于目前付費自習室多分布于人口密集、教育資源領先、付費意愿強烈的一線和新一線城市,故分別選取北京、上海、廣州、深圳、成都、長沙、鄭州七個城市中具有代表性的付費自習室作為分析對象,利用Python語言的Scrapy爬蟲框架對美團平臺上中付費自習室的在線評論進行解析,爬取得到近5000條在線評論文本數據,除去無效評論與不齊全記錄后篩選得到4538條評論作為樣本數據。

1.2 數據預處理

機械壓縮去詞:在美團付費自習室的在線評論中常存在著大量重復語料、顏文字、縮寫詞匯如“非常好好好好好好好好好,很安靜”“不錯不錯不錯”等,過于冗余,需要對其進行機械壓縮去詞處理[1]。

分詞:由于文本的句子中沒有詞的界限,因此在進行中文自然語言處理時,通常需要先進行分詞,并按照規則重新合成詞序列。本文采用Python開發的一個中文模塊——jieba分詞,對評論內容進行中文分詞。

過濾停用詞:在文本處理中,停用詞是指那些包含信息少且在文中大量出現的詞語。它們通常是一些單字及高頻的單詞,如“的”“甚至”“我”“嗎”等。因此,過濾停用詞能有效提高文本的檢索效率和效果,以避免對文本特別是短文本造成負面的影響。本文在哈爾濱工業大學停用詞表基礎上結合具體評論內容構建綜合停用詞表,對分詞結果進行過濾[2]。

表1 數據預處理結果

2 研究方法與分析

2.1 基于機器學習的情感分析

本文將收集到的10000條帶有標注的語料集作為訓練集,使用樸素貝葉斯模型進行訓練擬合,訓練出更好的詞向量,來預測新數據的分類結果,在準確率達到98.5%,損失率為0.61%的情況下,預測付費自習室的評論內容分為帶有正面情緒的評論與帶有負面情緒的評論兩類[3],結果如表2所示。

表2 情感分布情況

上述結果顯示,消費者對付費自習室的正面評價有4265條,占總評論條數的93.98%;消費者對付費自習室的負面評價有273條,占總評論條數的6.02%。從總體上說,當前消費者對付費自習室的評價大多為好評。但差評的內容更是關注的重點,情感分類只能直觀地看出消費者總體使用感受,不能得到具體的內容反饋。

2.2 語義網絡模型

為了找出各評論詞匯的主要內容之間的關系,進一步建立語義網絡模型,分別提取出正面情緒詞匯和負面情緒的高頻詞匯,并過濾掉無意義的詞語,基于高頻詞表提取特征值,最后構建正面評價語義網絡和負面評價語義網絡,生成共現矩陣詞表展現文本數據的一般關注對象[4]。語義網絡如圖1、圖2所示。

圖1 正面評價語義網絡

圖2 負面評價語義網絡

根據付費自習室正面評價的語義網絡圖,可得以下結論:在付費自習室的環境方面,正面語義網絡中存在安靜、干凈、氛圍等相似詞匯關系;在付費自習室的設施方面,正面語義網絡中存在微波爐、茶水、咖啡、零食等相似詞匯關系;在付費自習室的服務方面,正面語義網絡中存在姐姐、熱情、前臺等相似詞匯關系;在付費自習室的地理位置方面,正面語義網絡存在好找、區域、地鐵站等相似詞匯關系;在消費者體驗方面,正面語義網絡中存在舒服、沉浸、很棒、不錯、喜歡、效率等相似詞匯關系。

根據付費自習室負面評價的語義網絡圖,可以得到以下結論:在付費自習室的環境方面,負面語義網絡中存在隔音、裝修、味道、通風、空氣等相似詞匯關系;在付費自習室的設施方面,負面語義網絡中存在廁所、空調、桌子、衛生間等相似詞匯關系;在付費自習室的服務方面,負面語義網絡中存在小姐姐等相似詞匯關系;在付費自習室的地理位置方面,負面語義網絡中存在位置等相似詞匯關系;在消費者體驗方面,負面語義網絡中存在不好、花錢、體驗、略貴等相似詞匯關系。

為了更直觀地看出正面、負面語義的具體范圍,本文制作了詞云圖,如圖3、圖4所示。

圖3 正面評價詞云圖

圖4 負面評價詞云圖

綜上所 述,付費自習室能夠為我們提供安靜的學習氛圍,是受到消費者追捧的主要原因。付費自習室行業突然興起,大量商家跟風創建付費自習室的同時環境和設施并沒有達到消費者的要求,存在隔音不好、通風不暢、廁所臟亂少等問題。

2.3 主題模型

為對在線評論的潛在主題進行挖掘,展現主題之間的差異化特點,需要進行特征主題分析,進一步細化特征詞類型[5]。本文使用基于機器學習的情感分類結果產生的正面評價和負面評價作為輸入數據集,對不同情感傾向下的潛在主題分別進行挖掘,得到付費自習室評價的潛在主題與特征詞的概率分布情況,選擇前三個主題作為評論集中的熱點,并得出對應的熱點評論詞。

根據付費自習室正面評論的三個潛在主題的特征詞的提取,主題一中的高頻特征詞,即熱門關注點主要是“自習室”(0.026%)、“學習”(0.026%)、“安靜”(0.014%)、“體驗”(0.014%)、“環境”(0.014%)、“氛圍”(0.011%)、“不錯”(0.010%)、“地方”(0.010%)、“感覺”(0.009%)、“挺”(0.008%),由此可以看出,主題一主要是反映付費自習室很安靜;主題二的高頻特征詞,即熱門關注點主要是“自習室”(0.024%)、“環境”(0.023%)、“學習”(0.018%)、“不錯”(0.011%)、“體驗”(0.011%)、“特別”(0.010%)、“喜歡”(0.009%)、“免費”(0.008%)、“真的”(0.007%)、“姐姐”(0.007%),由此可以看出,主題二主要是反映消費者對付費自習室的環境很滿意;主題三的高頻特征詞,即熱門關注點主要是“學習”(0.054%)、“環境”(0.044%)、“安靜”(0.036%)、“不錯”(0.021%)、“適合”(0.016%)、“氛圍”(0.015%)、“姐姐”(0.013%)、“地方”(0.009%)、“自習”(0.009%)、“干凈”(0.009%),由此可以看出,主題三主要是反映付費自習室的學習氛圍良好。

將付費自習室正面評論的三個主題特征詞出現的概率進行統計加和,得到條形圖如圖5所示,可以明顯看出,付費自習室正面評論中主題分布差異較大,主題三占比最高,占0.226%,主題一、主題二分別占比0.142%、0.128%。由主題一主要關注在付費自習室的學習氛圍方面,我們可以得到結論:有自習需求的人們在家或多或少會被干擾,公共圖書館座位有限,咖啡館相對嘈雜,所以能提供良好學習氛圍的付費自習室逐漸受到了消費者的追捧。

圖5 付費自習室正向評論分布圖

根據付費自習室負面評論的三個潛在主題的特征詞的提取,主題一中的高頻特征詞,即熱門關注點主要是“環境”(0.017%)、“貴”(0.012%)、“自習”(0.009%)、“位置”(0.007%)、“價格”(0.007%)、“學習”(0.006%)、“座位”(0.006%)、“希望”(0.006%)、“體驗”(0.006%)、“卡”(0.005%),由此可以看出,主題一主要是反映消費者認為付費自習室價格貴;主題二的高頻特征詞,即熱門關注點主要是“自習室”(0.010%)、“學習”(0.009%)、“環境”(0.009%)、“廁所”(0.008%)、“位置”(0.008%)、“吵”(0.008%)、“樓下”(0.007%)、“公共”(0.007%)、“服務”(0.006%)、“區域”(0.005%),由此可以看出,主題二主要是反映消費者認為付費自習室周圍環境吵;主題三的高頻特征詞,即熱門關注點主要是“自習”(0.008%)、“通風”(0.007%)、“地方”(0.007%)、“差”(0.006%)、“學習”(0.006%)、“空調”(0.006%)、“唯一”(0.006%)、“房間”(0.005%)、“特別”(0.005%)、“太”(0.005%),由此可以看出,主題三主要是反映消費者認為付費自習室通風不好,空氣差。

將付費自習室負面評論的三個主題特征詞出現的概率進行統計加和,得到條形圖如圖6所示,可以明顯看出,付費自習室負面評論中主題分布差異不大,主題一、主題二、主題三分別占比0.081%、0.077%、0.061%。根據三個主題關注的內容,我們可以得到結論:消費者對付費自習室不滿意的原因有付費自習室價格較昂貴;付費自習室所處的地理位置周圍環境不安靜;付費自習室通風不是太好,空氣質量差。

圖6 付費自習室負向評論分布圖

3 結論與建議

3.1 相關結論

為得到消費者對付費自習室的客觀全面的評價,本文在對美團平臺中付費自習室在線評論的文本挖掘過程中,進行了情感分類、語義網絡分析和LDA模型主題分析,實證研究的結果為當前消費者對付費自習室的評價大多是正向評價;付費自習室受到消費者的追捧的主要原因是提供好的學習氛圍;消費者對付費自習室不滿意的主要原因是付費自習室價格昂貴、付費自習室所處的地理位置周圍環境不安靜、付費自習室通風不好、空氣質量差、付費自習室的廁所等設施有待完善等。

3.2 相關建議

建立分區自習室,分人群收費,合理定價:由于每個受眾的收入水平不一,對付費自習室價格的接受程度也不同,因此可以建立低價區和高價區等不同類型自習室,滿足不同消費水平人員的需求。同時利潤高和利潤低的自習室能綜合維持企業的持續經營[6]。

合理選址,選擇安靜的環境:學習環境是影響學習效率的一大因素,商家在選擇付費自習室的創建地點時,應該盡量選擇周圍環境安靜的地點;另外,商家應使用隔音較好的隔板及靜音設備,給消費者提供安靜的學習環境[7]。

優化付費自習室的設施:商家在付費自習室中盡可能地提供便利服務,付費自習室的設施應更加齊全,提供干凈充足的公共衛生間、日常生活的必需品與寬敞的學習空間,另外室內也要常通風,保持空氣清新[8]。

猜你喜歡
語義詞匯消費者
本刊可直接用縮寫的常用詞匯
消費者網上購物六注意
今日農業(2020年20期)2020-12-15 15:53:19
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
語言與語義
本刊可直接用縮寫的常用詞匯
知識付費消費者
悄悄偷走消費者的創意
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
悄悄偷走消費者的創意
認知范疇模糊與語義模糊
主站蜘蛛池模板: 免费毛片在线| 国产午夜看片| 国产白浆在线观看| 美女国内精品自产拍在线播放| 成人免费一区二区三区| 久久久久无码精品| 国产激爽大片在线播放| 国产av无码日韩av无码网站| 999在线免费视频| 国产微拍精品| 伊人久久综在合线亚洲2019| 免费Aⅴ片在线观看蜜芽Tⅴ | 欧美亚洲日韩中文| 国产美女精品一区二区| 亚洲经典在线中文字幕| 国产一级α片| 99国产精品国产| 婷婷综合亚洲| 狠狠v日韩v欧美v| 亚洲无限乱码| 高清久久精品亚洲日韩Av| 国产9191精品免费观看| 国产成人精品无码一区二| 青草娱乐极品免费视频| 亚洲天堂网在线观看视频| 亚洲乱码精品久久久久..| 久久久久无码精品国产免费| 综合久久五月天| 色综合天天娱乐综合网| 天堂网亚洲系列亚洲系列| 夜色爽爽影院18禁妓女影院| 丁香婷婷激情综合激情| www欧美在线观看| 思思99思思久久最新精品| 精品国产免费观看一区| 青青草欧美| 国产成人一区在线播放| 国产免费久久精品99re丫丫一| a级毛片在线免费| 久久黄色免费电影| 精品无码国产一区二区三区AV| 日本一本在线视频| 国产亚洲高清在线精品99| 二级特黄绝大片免费视频大片| 一本无码在线观看| 国产欧美在线| 91精品国产自产在线老师啪l| 国产日本欧美亚洲精品视| 久草国产在线观看| 国产免费精彩视频| AV不卡无码免费一区二区三区| 毛片久久久| 国产欧美日韩另类| 最新日韩AV网址在线观看| 成人福利在线免费观看| 日韩精品一区二区三区免费| 免费一极毛片| 精品综合久久久久久97超人| 国产成人精彩在线视频50| 午夜一级做a爰片久久毛片| 久无码久无码av无码| 福利小视频在线播放| 高清精品美女在线播放| 日韩专区第一页| 国产精品毛片一区| 无码视频国产精品一区二区| 久久国语对白| 午夜免费视频网站| 精品91在线| 婷婷色在线视频| 久久国语对白| 国产精品密蕾丝视频| 五月六月伊人狠狠丁香网| 中文字幕一区二区视频| 国产十八禁在线观看免费| 又猛又黄又爽无遮挡的视频网站| 久久中文无码精品| 国产乱论视频| 国产成人精品日本亚洲| 久久精品国产一区二区小说| 久久精品电影| 在线观看国产小视频|