999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA主題模型的興文石海景區在線評論情感挖掘分析

2025-07-25 00:00:00戴慶春郭香君尹瑞琦榮幸
中國市場 2025年21期
關鍵詞:石海興文景區

摘 要:目前游客通過旅游平臺了解、評價旅游目的地,發表旅游感受已經成為常態,如果能有效挖掘這些游客留下的大量評論信息,對于改善旅游體驗、提升旅游目的地品質不無裨益。文章首先抓取2019年6月—2023年6月,攜程、同程、去哪兒關于宜賓興文石海的3175條評論信息;其次運用LDA主題模型進行文本挖掘,提取游玩內容、交通狀況、設施服務、自然風光4個主題;再利用Python中的SnowNLP庫對提取的關鍵詞進行情感分析,判定游客的正面和負面情緒,了解景區需要改進完善之處;最后從軟硬件提升、文化挖掘與展示等方面提出改進建議。

關鍵詞:興文石海景區;LDA主題模型;文本挖掘技術;SnowNLP情感分析

中圖分類號:F592.7文獻標識碼:A文章編號:1005-6432(2025)21-0106-04

DOI:10.13939/j.cnki.zgsc.2025.21.027

1 引言

興文石海景區位于四川省宜賓市興文縣石海鎮境內,是聯合國教科文組織批準的第二批世界地質公園,國家重點風景名勝區、國家AAAA級旅游區。總面積約156平方千米,核心景區14平方千米范圍內集中了石海景觀、地下溶洞群、世界級的大漏斗,被專家譽為喀斯特地貌博物館。文章旨在借助網絡文本挖掘技術,通過分析游客在旅游網站上發布的對于興文石海的評論信息,了解游客關注的主題和他們的情感傾向,以期為興文石海景區管理者提供游客體驗的數據及分析結論,有助于提升興文石海的旅游體驗,為其可持續發展提供支持。

2 研究方法

2.1 文本挖掘技術

文本挖掘(TM,text mining)是以計算語言學、數理統計為理論基礎,結合信息檢索技術、機器學習從文本數據中發現和提取隱含信息。它是一個從文本信息描述到選取提取模式,最終形成用戶可理解的信息知識的過程。

2.2 LDA主題模型

主題模型是一種語言模型,是在機器學習和自然語言處理等領域用來在一系列文檔中發現隱含主題的一種統計模型,可以對文本進行語義挖掘。LDA(latent dirichlet allocation)主題模型由Blei于2003年提出,包含詞項、主題和文檔三層結構,基本思想是把文檔看成其隱含主題的混合,而每個主題則表現為跟該主題相關的詞項的概率分布,文檔和單詞都是可交換的,忽略單詞在文檔中的順序和文檔在語料庫中的順序,從而將文本信息轉化為易于建模的數字信息。

2.3 SnowNLP情感分析

SnowNLP是一個基于TextBlob的中文自然語言處理Python庫,其主要功能包括中文分詞、情感分析、文本分類等。SnowNLP使用的是樸素貝葉斯原理來訓練和預測數據,可以對中文文本進行情感分析,操作簡單且容易實現。SnowNLP模塊會逐一計算每一條文本的正面情感概率。當正面情感概率P≥0.5 時認為該評論為正面情感評論,Plt;0.5時則為負面情感評論。

3 研究設計

首先,通過自行編寫的網絡爬蟲軟件,在去哪兒、攜程和同程等主流旅游平臺上以“興文石海”為關鍵詞,進行評論文本數據的采集和抓取;其次,對獲取的評論數據進行去重、分詞和去停用詞等預處理;再次,對經過預處理的文本數據使用Python的gensim庫來構建 LDA主題模型,得到主題數量及主題關鍵詞;最后,運用Python中的SnowNLP庫對主題及關鍵詞進行情感分析,并基于上述研究結論提出了對策建議。研究流程詳見圖1。

4 數據獲取及預處理

4.1 在線評論數據來源

攜程、同程和去哪兒這三家旅游資訊平臺經過多年的積累,擁有龐大的用戶群體,重視內容生態,支持用戶撰寫游記、攻略、評論打分。選擇攜程、同程和去哪兒作為文章數據獲取渠道,確保了評論數據的有效性、真實性和樣本數量的充足性。文章運用 Python編寫的爬蟲程序,抓取了2019年6月至2023年6月,上述三大平臺上關于“興文石海”的3175條評論。每條評論數據都具有用戶評分、評論內容、時間、年以及評論長度這5個特征。

4.2 數據預處理

4.2.1 數據去重

為了吸引到更多的游客,景區會選擇刷較多重復的高分好評,使景區的評分偏高;同時,為了誘導游客對景區進行評論,景區對參與評論的游客進行回饋,此類游客為了省事,會直接復制好評的評論。對于以上行為,產生了較多的重復評論,并造成數據的失真,因此,這一類評論文本必須進行去重處理。

4.2.2 去停用詞和分詞

抓取的評論文本屬于非結構化數據,存在大量的噪聲數據,如各種表情符、特殊符號、網頁標簽等;同時還有大量的高頻但無實際意義的詞,如各種語氣助詞、連接詞、介詞等。正式進行文本挖掘前需要進行去停用詞和分詞處理。文章停用詞庫的構建主要是選取哈工大 、百度和四川大學停用詞庫進行停用詞去重整合,再利用Python中Jieba包完成文本信息的分詞。

在經過分詞和去停用詞后,查看輸出結果,對軟件分析不準確或分詞錯誤的部分進行人為修正,將修正的詞語加入到用戶自定義詞典中,與研究無關的詞匯添加到停用詞表中,不斷重復上述過程,直至隨機抽取評論展示的分詞效果良好。

5 LDA主題模型

5.1 詞頻分析

對抓取的數據做詞頻分析,為直觀地展現用戶評論所關注的重點與主題,摘取評論分詞后頻率最高的前40個詞語,利用Python中的Wordcloud繪制高頻詞詞云,圖中文字的大小對應詞匯出現頻次的高低(詳見圖2)。

圖2 詞云

從表1的高頻詞分布來看,可以得出以下五點結論。

第一,游客最關注的是景區的風景,“景點”“景色”“風景”“景觀”“環境”等詞的詞頻數較多,排在詞頻統計表的前面,表現出游客對景區的期待中,風景好的程度占比較高。

第二,高頻詞“溶洞”“天坑”“天泉”“燈光”“懸棺”等內容是景區的主要游玩地點,景區薈萃了中國南方最具代表性的喀斯特地質景觀,著名景觀有天泉洞、地表石海、天下第一漏斗,與游客感受到的相契合。

第三,“停車場”“交通”“觀光車”“電梯”“走路”等詞的詞頻數表現出游客對景區的基礎設施要求,游客如何到達景區以及在景區內往返的便捷性。

第四,“門票”“工作人員”“服務”“特色”“訂票”“價格”“優惠”等詞反映出游客對景區收費與服務的關心,買票的便捷性、工作人員的服務態度將會影響游客對景區的評價。

第五,“朋友”“夫妻”“家人”“孩子”“大家”等詞的出現,反映出景區的游客人群比較廣泛,可以和孩子一起游玩,也可以和朋友們一起游玩,出游形式多樣。

5.2 主題提取

文章基于Python的Gensim庫構建LDA主題模型,用于識別游客關注的景區主題特征。通過主題間距分析發現,當主題數量設置為4時,模型表現出最優的區分度:各主題在語義空間中的離散程度最大,且主題間重疊程度最低。這一結果表明,4個主題的設定能夠有效捕捉游客關注點的異質性特征,同時保持主題間的獨立性和可解釋性。因此,本研究最終采用4個主題的模型架構進行后續分析。

將主題數4代入LDA 模型,在生成主題關鍵詞中選擇前10個關鍵詞,這10個關鍵詞確定了每個主題的核心特征。根據每個主題的主題關鍵詞表達的相似內容為主題命名。根據主題一的關鍵詞內容,大多為對于興文石海景區游玩內容的描述,例如“石海”“天泉”等,故將主題一命名為“游玩內容”;主題二的關鍵詞內容大都為對于景區交通與路程的描述,例如“車位”“觀光車”等,故將主題二命名為“交通狀況”;主題三的關鍵詞內容大都為景區服務內容與基礎設施,例如“門票”“垃圾桶”等,故將主題三命名為“設施服務”;主題四的關鍵詞與主題一相近,但主要為對于景區風景的描述,故將主題四命名為“自然風光”。具體內容如表2所示。

6 情感分析

借助Python中的SnowNLP情感分析器對在線評論進行情感值計算,輸出結果范圍為0~1,所得結果分數越高即表示情感傾向越積極,所得結果分數越低即表示情感傾向越消極。

根據情感分析,游客對景區的積極情感傾向主要來源于。

第一,對于景區風景秀麗,奇特景觀的贊嘆。評論中提到“國家級風景名勝區,中國最美的十大地質公園,里面自然奇觀數不勝數”“嘆為觀止,大自然的鬼斧神工”“見證大自然的鬼斧神工,將自身融入大自然中,放松自我,享受生活”。景區特有的地質條件,喀斯特地貌與地下溶洞等奇特景觀是興文石海的核心競爭力。

第二,對多元游玩方式的喜歡。“周末帶孩子出來玩”“大人孩子都玩兒得很開心”“和朋友一起出去玩”“景區游玩項目老少皆宜,并設有親子互動項目與戶外探險項目,可用于家人、朋友們一起運動,冒險”“增長見聞,研學有收獲”。景區自然景觀、地質遺跡與僰苗文化相融,有研學價值,值得深挖。

第三,對票價和購票便捷的滿意。“網上訂票要便宜20元,我們三個人就省掉了60元”“同程訂的9.9的門票,超值”“取票很方便,購票的二維碼或者訂票人的身份證”。景區在多種平臺上售票,聯合平臺設置優惠套餐,對游客有一定吸引力。

游客對景區的消極情感傾向主要來源于:

第一,對景區管理水平的詬病。“配套太差,住不好吃不好”“服務差,外面歪導游多,也沒有人管理。景區管理混亂”“配套差,特別是餐飲,宰客”。 景區內外的住宿與餐飲好壞情況對游客是否選擇前來游玩有較大影響。

第二,對交通不方便的抱怨。“一路顛簸轉了兩趟大巴花了將近四個小時終于進入了石海。長途跋涉后讓人的興致頓時減少”“交通票現場買的,有點坑”“走了五個多小時”。自然風光獨特的景區往往地處較偏遠,交通問題是個難題。

7 結論與建議

文章通過LDA模型對網絡平臺評價文本進行情感挖掘分析,獲取文本信息中所表達的情感傾向,了解游客對興文石海景區自然風光、旅游項目、設施服務的體驗,得出的研究結論有利于提高興文石海景區的管理、服務水平。基于以上研究,對興文石海景區提出以下建議。

第一,加大投入,優化和完善旅游設施。包括提升交通設施,如增設停車場、優化景區內的交通線路;改善住宿條件,提供多樣化的住宿選擇,滿足不同游客的需求;完善餐飲設施,提供豐富多樣的地方特色美食;增設休息娛樂設施,如休息區、游客服務中心等,以提升游客的舒適度和滿意度。

第二,加強對石海文化的挖掘和研究,通過舉辦文化講座、展覽等形式,向游客展示石海文化的魅力和價值。同時,結合地方歷史文化,開發具有特色的文化體驗項目,使游客在游覽過程中能夠深入了解和體驗石海文化。

第三,建立完善的游客服務管理體系,包括優化游客導覽系統、加強安保措施、提高服務人員素質等。同時,建立游客反饋機制,及時了解游客的需求和意見,不斷改進服務質量,提升游客的滿意度和忠誠度。

第四,開展異業合作拓寬旅游項目。利用石海大溶洞空曠的場地、天然的混響效果,聯合音樂節主辦機構舉辦一年一度的“溶洞音樂節”,借助新媒體進行有效傳播,吸引更多的年輕人,打造成特色項目。

參考文獻:

[1]司育.基于LDA主題模型的山西省熱門景區綜合評價體系研究[D].太原:山西財經大學,2023.

[2]孫正軒,馬海群.基于LDA主題模型的信息行為熱點主題及發展趨勢研究[J].情報探索,2023(11):35-43.

[3]張大釗,李顯正,趙振斌,等.基于LDA制圖分析的古鎮旅游地游客商業化體驗及空間結構——以大理古城為例[J].經濟地理,2023,43(8):200-209.

[4]郝若琳,黃萍,何慧敏,等.四川省5A級旅游景區線上評論的文本情感分析[J].西部旅游,2022(12):1-3.

[5]張學民,趙明宇.基于LDA和情感分析的西塘古鎮旅游形象研究[J].河北工業大學學報(社會科學版),2020,12(3):23-30

猜你喜歡
石海興文景區
千軍萬馬奪陳倉
商界(2025年8期)2025-08-21 00:00:00
攀登五大連池火山
家庭百事通(2025年8期)2025-08-18 00:00:00
1元冰棍如何拯救一個破產5A級景區
領導文萃(2025年15期)2025-08-12 00:00:00
民族村寨旅游社區化與景區化路徑特征與成因研究
低空經濟視域下無人機技術在旅游景區中的創新融合應用
基于地理探測器的浙江省3A級景區村莊時空演變及影響機理
主站蜘蛛池模板: 黄色网址免费在线| 91九色最新地址| 欧美国产另类| 又污又黄又无遮挡网站| 毛片免费在线视频| 亚洲天堂免费| 亚洲免费毛片| 熟妇人妻无乱码中文字幕真矢织江 | 亚洲三级影院| 四虎成人免费毛片| 日本在线欧美在线| 亚洲无码A视频在线| 亚洲AⅤ无码国产精品| 国产成人艳妇AA视频在线| 播五月综合| 夜夜操国产| 天堂成人在线视频| 欧美黑人欧美精品刺激| 日韩欧美国产成人| 首页亚洲国产丝袜长腿综合| 视频一本大道香蕉久在线播放| 欧美亚洲一区二区三区在线| 欧美国产在线看| 久久无码av一区二区三区| 亚洲中文字幕久久无码精品A| 国产精品无码AV片在线观看播放| 国产97视频在线| 免费看一级毛片波多结衣| 五月激情婷婷综合| 在线观看国产网址你懂的| 乱人伦视频中文字幕在线| 午夜视频在线观看区二区| 日韩毛片在线视频| 欧美第九页| 大陆精大陆国产国语精品1024| 免费毛片视频| 国产91高清视频| 精品人妻一区无码视频| 欧美精品1区| 无码'专区第一页| 91成人免费观看| 一级不卡毛片| 国产国产人在线成免费视频狼人色| 中文字幕无线码一区| 国产视频欧美| 欧洲熟妇精品视频| 成人福利在线视频免费观看| 成人精品视频一区二区在线| 婷婷丁香色| 91福利免费| 国产后式a一视频| 91久久偷偷做嫩草影院免费看 | 免费无码网站| 中文字幕第4页| 国产成人精品在线| 亚洲中文在线看视频一区| 亚洲高清中文字幕| 91无码视频在线观看| 亚洲欧美精品在线| 色妞永久免费视频| 综合色天天| 欧美日本在线观看| 亚洲乱伦视频| 亚洲一区毛片| 国产亚洲高清视频| 91视频区| 黄色福利在线| 国产精品吹潮在线观看中文| 中文字幕乱码二三区免费| 蜜芽国产尤物av尤物在线看| 亚洲视频二| 国内精品小视频在线| 亚洲国产天堂久久综合| 成人字幕网视频在线观看| 露脸国产精品自产在线播| 波多野结衣二区| 中文国产成人精品久久| 欧美国产精品拍自| 日本在线欧美在线| 激情爆乳一区二区| 露脸国产精品自产在线播| 丰满人妻久久中文字幕|