999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

武夷山景區游客在線評論的可視化分析

2021-05-28 12:37:54吳清壽張祎航羅遠華
現代計算機 2021年10期
關鍵詞:可視化

吳清壽,張祎航,羅遠華

(武夷學院數學與計算機學院,武夷山354300)

0 引言

在線旅游網站上的游客評論能夠較好地反映旅游目的地的“吃住行娛購游”等旅游六要素的真實情況。對游客在線評論進行采集和可視化分析,可以給旅游行業管理部門,旅游企業和其他游客提供有益的參考。

基于評論數據的挖掘分析研究中,郭麗環等人[1]等以廈門地區酒店的在線評論數據為研究對象,分析了游客在酒店選擇上的情感傾向。鮑珊珊等人[2]以國內主題公園為研究對象,通過分析游客在線評論,對主題公園的發展提出了參考意見。王雨文等人[3]等采集了游客對湄洲島景區的評論內容,從多個維度對相關要素進行了滿意度分析。通過詞共現網絡進行各個領域相關熱點的研究也逐漸成為了一種趨勢,如胡丹妮等人[4]基于詞共現網絡對國內教育教育的專業建設現狀進行了分析研究,趙麗梅等人[5]等分析了智慧圖書館中的四個主要研究熱點。

本文以針對武夷山景區的在線評論數據為研究內容,利用相關技術從評論數據中抽取關鍵詞,之后,利用詞云和詞共現網絡對高頻關鍵詞進行可視化分析。

1 數據采集

本研究以攜程網上游客對武夷山景區的在線評論數據為研究對象,采集內容包括評論內容、旅游目的地名稱和評論時間三個要素,本文主要對指定時間段內的評論文本進行分析。

數據采集步驟如下:

(1)從瀏覽器中獲取User-Agent,將爬蟲腳本模擬成真實的瀏覽器請求;

(2)用Python中的requests庫模擬瀏覽器請求旅游目的地頁面的URL;

(3)用lxml庫對網站返回的信息進行解析,并提取所需數據;

(4)把獲取的評論數據內容寫入文件進行保存。

2 評論數據分析技術

評論文本需要經過系列處理,最后得到每條評論的關鍵詞。其主要流程包括:中文分詞、停用詞處理、加入自定義詞庫和關鍵詞抽取等步驟。

2.1 分詞與停用詞處理

游客評論數據是非結構化數據,首先需要對其進行分詞處理。本文采用jieba分詞工具包進行分詞。jieba工具包包含多種分詞模式,如精確模式、全模式和搜索引擎模式等。其中,精確模式下,每個字符只會出現在一個詞語中,有利于后續的詞頻統計和數據分析。

分詞后的數據中仍包含一些無助于語義分析的詞語,如“的”、“呢”、“了”等,所以對詞庫進行停用詞刪除操作。停用詞庫采用文獻[6]中的詞庫,其包括中文停用詞表、哈工大停用詞表、百度停用詞表和四川大學機器智能實驗室停用詞庫。

2.2 自定義詞庫

jieba庫對于陌生的詞組不能準確地識別為一個詞,如:“印象大紅袍演出真好看!”,默認情況下,分詞結果為“印象/大紅袍/演出/真/好看!”。這個問題對游客評論數據分析有較大的影響。因為武夷山有大紅袍景區和印象大紅袍劇場,上述的分詞結果可能會分析為游客對大紅袍景區的印象為好看,這與游客評論的初衷相悖。

為解決這個問題,本研究采用了人工標注的方法,即對于一些表示評論主體的詞匯,如果jieba無法正確識別,就通過人工標注的方法,將完整的詞匯加入到自定義詞庫,并逐步將自定義詞庫加入到jieba庫中。通過自定義詞庫,能夠有效地識別出游客評論信息中的主體對象。如將“印象大紅袍”作為一個自定義詞,則最終的分詞結果為“印象大紅袍/演出/真/好看!”

2.3 基于TextRank的關鍵詞抽取

由上述步驟得到的詞語中仍存在較多的冗余詞匯,需要用TextRank算法進一步抽取關鍵詞,其主要步驟如下:

(1)首先進行評論文本預處理。基于自定義詞庫和停用詞庫,將文本劃分為預處理詞庫;

(2)將預處理詞庫中的Word添加到圖(Graph)中,作為圖中的一個節點;

(3)對處于同一窗口范圍內的Word之間建立一條連邊;

(4)用PageRank算法計算圖中節點的pr值;

(5)選取topk個pr值最大的節點所對應的Word作為關鍵詞。

其中,PageRank算法[7]計算網絡中節點的pr值,pri表示節點vi在的影響力值,其第t輪迭代的值定義如式(1):

在無向圖中,Γi表示vi的鄰居節點集合,N為網絡中節點數量,參數α設為0.85。

3 數據分析與可視化

3.1 高頻詞分析

本次采集游客評論數據30000條,經分詞處理后和自定義詞庫處理后,最后得到詞頻最高的關鍵詞600個,其中,詞頻最高的20個詞如表1所示。

表1 詞頻最大的20個詞語

可以看出,游客對于武夷山旅游中印象最深刻的景點就是“竹筏”、“天游峰”、“九曲溪”等主流景點。游客對武夷山旅游的情感也基本是正面的,如“值得”、“震撼”和“喜歡”。

3.2 基于詞云的高頻詞分析

為了更加直觀的觀測游客評論喜好,本部分選擇詞頻最大的30個和100個詞語進行可視化,可視化工具選擇WordCloud??梢暬Y果如圖1所示。圖1(a)中的結果與表1較為接近,顯示“竹筏”和指代“竹筏”的“漂流”是游客關注的熱點。圖1(b)中展示了更多的信息,如“大王峰”、“水簾洞”和“虎嘯巖”等更小眾的景點也出現在游客的高頻次評論中。同時,可以看到“表演”、“舞臺”、“旋轉”等詞語,這些基本都是對印象大紅袍劇場的評價。

圖1 高頻詞的詞云圖

3.3 詞共現網絡

通過構建詞共現網絡,可以更好地展示游客對評價主體的總體認知。把一個關鍵詞(如“九曲溪”)當做詞共現網絡中的一個結點,以句子為計算單位,構建詞共現關系。詞與詞的共現詞數是作為兩個節點的權重,權重越大,節點的語義相關性越強。此處選擇共現權重為50和300的關鍵詞構建共現網絡,得到結果如圖2所示。

圖2 詞共現網絡

圖2中,權重越小,則滿足條件的連邊越多,節點間的聯系越緊密。通過擴大權重,稀疏化節點的連邊關系,可以更好地觀測游客評論中共同出現的詞匯情況。如圖2(b)中所示,提到武夷山,更多出現的是武夷山的相關景點,如“大紅袍”、“玉女峰”等。另外,反映武夷山地理特征的“丹霞地貌”在大量出現在有關武夷山景區的相關評論中。

4 結語

本文介紹了游客評論數據的采集、分析和可視化的主要技術和流程,并對數據可視化結果進行了分析?;谠~云的可視化能夠更好地揭示游客的評論重點及對旅游目的地的情感傾向,而基于詞共現網絡的可視化能夠在更多細節上反映出游客對具體旅游要素的觀感。

在下一步的研究中,將繼續完善自定義詞庫,以提高中文分詞中的主體識別準確率。本文的詞共現網絡分析的主體還不夠精細,要進一步完善算法,以期能實現對單一主體的挖掘分析。

猜你喜歡
可視化
無錫市“三項舉措”探索執法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統在選煤生產中的應用
選煤技術(2022年2期)2022-06-06 09:13:12
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 亚洲天堂网视频| 伊人久久精品亚洲午夜| 91成人精品视频| 欧美激情一区二区三区成人| 国产呦视频免费视频在线观看| 国产成人综合久久| 国产无码制服丝袜| av在线5g无码天天| 国产好痛疼轻点好爽的视频| 91久久精品国产| 99视频精品全国免费品| 99青青青精品视频在线| 韩日午夜在线资源一区二区| 在线色国产| 欧美在线黄| www.99精品视频在线播放| 久久先锋资源| 老司机午夜精品网站在线观看| 人妻无码中文字幕一区二区三区| 精品国产成人av免费| 精品撒尿视频一区二区三区| 特级欧美视频aaaaaa| 午夜视频在线观看区二区| 色婷婷久久| 亚洲国产成人超福利久久精品| 国产精品综合久久久| 69av免费视频| 亚洲综合一区国产精品| 72种姿势欧美久久久大黄蕉| 国产精品福利导航| 91丨九色丨首页在线播放| 毛片免费试看| 亚洲性日韩精品一区二区| 久久77777| 国产乱子伦一区二区=| 国产网站一区二区三区| 人人爱天天做夜夜爽| 亚洲福利片无码最新在线播放| 日本爱爱精品一区二区| 中文一级毛片| 成人午夜精品一级毛片| 亚洲欧美成人| 99精品热视频这里只有精品7| 狠狠亚洲五月天| 国产精品偷伦在线观看| 波多野一区| v天堂中文在线| 欧美a在线看| 欧美综合区自拍亚洲综合绿色| 综合网久久| 一级毛片免费观看不卡视频| 91视频国产高清| 成人福利在线视频| 日本午夜视频在线观看| 丁香亚洲综合五月天婷婷| 天天激情综合| 久久精品中文字幕免费| 无码啪啪精品天堂浪潮av| 在线欧美a| 亚洲国产中文欧美在线人成大黄瓜 | 青青青视频蜜桃一区二区| 日本三级精品| 一级在线毛片| 亚洲色欲色欲www网| 国产乱子伦精品视频| 免费一级毛片完整版在线看| 国产va欧美va在线观看| 午夜丁香婷婷| 亚洲清纯自偷自拍另类专区| 久久精品人人做人人综合试看| 中文字幕在线一区二区在线| 国产欧美日韩va另类在线播放| 亚洲视频色图| 91尤物国产尤物福利在线| 亚洲aaa视频| 天天婬欲婬香婬色婬视频播放| 无码一区二区三区视频在线播放| 亚洲精品国产日韩无码AV永久免费网 | 亚洲aaa视频| 国产精品久久自在自线观看| 亚洲午夜福利精品无码不卡| 久久精品91麻豆|