999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于社交媒體數據的北京游客情感體驗及時空特征研究

2022-11-03 12:46:08佟,孟
綠色科技 2022年19期
關鍵詞:語義文本旅游

楊 佟,孟 斌

(北京聯合大學 應用文理學院,北京 100101)

1 引言

情緒地理學是基于傳統人文地理學分支學科對情緒與空間關系關注的基礎上[1],逐漸發展而來的一門新興的跨學科研究領域。國外對于情感地理問題的研究主要在以下方面:人類心理和生理健康[2]、地方感知[3]、地方依戀[4]、游客情感的時空特征及規律[5]、情感背景下的城市規劃[6]等。情感計算是針對具體的文本內容進行處理、分析,將其分為正面、負面、中性等情感類型的過程[7]。進入21世紀之后,游客情感研究在方法論和機制探索上日漸成熟,而文本內容挖掘是情感分析的主要研究方向。早期的情感分析主要是基于文本數據,對詞語語義的情感傾向進行計算和分析。之后有學者在情感詞典的基礎上,通過設計情感計算規則計算游客情感[8]。

近年來,越來越多的旅游者利用網絡媒介獲取旅游信息。同時,用戶將自己的原創內容通過網絡平臺發布,“由用戶產生的內容(user-generated content,UGC)”的概念逐漸興起[9],一般指旅游者在社交媒體平臺上通過發布旅游文字和照片、撰寫攻略、分享旅游視頻等方式留下的游覽足跡。社交媒體數據因其獲取省時省力、真實可靠,逐漸被應用于科學研究中。學者可以通過分析用戶原創內容,從游客自身的角度研究游客的行為和情感特征,這為旅游研究拓展了新的方法和視角。在此背景下,許多國內外學者借助社交媒體數據率先開展了大數據時代下的旅游研究:利用地理標記照片分析中國入境旅游流時空分布特征[10,11];以旅游門戶網站爬取的游記、評論為研究數據,分析游客對旅游目的地形象的感知[12,13];利用游客簽到數據對文保單位的關聯度進行定量測度[14];以UGC圖片元數據研究旅游目的形象[15];融合氣象數據和UGC文本數據分析游客情感與氣候之間的相關關系[16];利用機器學習方法對文化資源密集區進行感知研究[17]。

綜上,本文以北京市的16個市轄區作為案例地,借助新浪微博文本數據,研究北京游客的正負面情感特點和時空特征,以豐富地理學在情感研究的視角和方法,并為提升城市旅游服務和改善基礎設施建設提供理論依據,并進一步拓寬社交媒體數據的應用領域。

2 研究區概況與數據源

2.1 研究區概況

北京是我國政治中心、文化中心、國際交流中心、科技創新中心。此外,北京擁有豐富旅游資源,其中對外開放的旅游景點達200多處,擁有文物古跡7309項,國家重點文物保護單位99處,市級文物保護單位326處。2019年,北京市接待游客總人數3.22億人次,比2018年增長3.6%。其中,接待國內游客3.18億人次,增長3.7%。這座城市作為中國形象和象征,一直受到國內外的高度關注。

2.2 數據源

新浪微博平臺是當下中國最熱門的社交媒體平臺之一,依據新浪微博官方發布2020年微博用戶發展報告顯示,截至2020年9月份微博月活躍用戶達5.11億個,日活躍用戶達到2.24億個。利用新浪微博官方API,抓取時間為2019年的全北京市域內的微博數據,其中每條數據均包含文本內容、用戶編號、經緯度、發布時間等字段,獲取北京市2019年微博用戶數據1175余萬條,數據結構如表1所示。

表1 微博數據結構示例

3 研究方法

3.1 基于BERT模型的旅游行為分類與識別

BERT(Bidirectional Encoder Representation from Transformers)是由Google公司在自然語言處理(NLP)中的一項重大突破[18],該模型能夠大幅提升文本識別的準確度。本文采用BERT模型,利用Python語言進行編譯,對微博文本內容進行機器學習,提取與旅游相關微博文本。本研究中具體文本處理方法如下:首先,篩選出北京非本地用戶微博數據共4206915條,隨機選擇20000條數據作為訓練樣本。針對每條文本,如果它與旅游活動有關,則手動標記為1,反之,則標記為0。第二,利用機器學習和BERT模型對20000條訓練數據進行預處理,并驗證分類精度,通過多次調整相應參數和迭代次數,得到訓練好的文本分類模型,精度達到93%。第三,基于該分類模型,將所有的微博數據進行分類,最終識別出2019年北京游客旅游活動數據共247469條。最后,從旅游活動數據中隨機挑選5000條進行了人工驗證,平均準確率達到98.3%,驗證了該模型具有良好的分類效果。

3.2 基于ROST Content Mining的文本分析

ROST Content Mining軟件是武漢大學沈陽教授發明,用于挖掘文本內容的系統軟件,該方法主要專門針對網絡媒體上的信息內容,對文本資料進行分詞處理、高頻詞統計,以及聚類、相關性、情感趨向、時序等分析,構建出社會網絡、語義網絡等[19]。本文主要利用ROST CM6軟件,針對文本內容首先進行分詞處理和高頻詞統計,并計算游客情感值,同時針對正負面情感的高頻詞構建語義網絡。

3.3 局域Getis-Ord Gi*指數法

Getis-Ord Gi*統計是一個熱點分析模型,通過z得分和p值可以看出高值或低值要素在空間上發生聚類的位置[20]。熱點分析工具的目標就是識別出具有統計顯著性的聚類區域。基本的邏輯是,按照一定鄰域,重新抽樣數據,根據本地數據均值相對于總體均值的偏離度,來判斷空間分布的隨機性是否成立。假設條件就是要素在空間分布上是隨機獨立分布的,那按照空間加權計算后的結果勢必呈現出正態分布[21]。

4 結果分析

4.1 詞頻分析

詞頻統計結果如表2所示,“打卡”一詞的頻率最高,反映出打卡行為是游客的主要旅游行為之一。“故宮”“故宮博物院”“頤和園”“天安門廣場”和“圓明園”等高頻詞反映出游客在北京旅游的主要目的地,多位于具有豐富文化和歷史的5A景區。“吃”“走”“拍”和“逛”等高頻動詞說明游客旅游的主要旅游活動。“天氣”“好熱”等高頻詞可以看出游客對于天氣的關注以及游客對天氣炎熱的抱怨。“烤鴨”“吃”等高頻詞可以看出游客對北京特色美食的關注。

表2 旅游行為相關微博高頻詞

4.2 游客情感值計算結果

本文對北京游客發送的網絡文本進行情感分析,得到積極、中性、消極3種情感類型,并對積極情緒和消極情緒按程度劃分為一般、中度、高度,結果如表3所示。積極情感微博數量為118035條,占比47.70%;中性情感微博數量為91371條,占比36.92%;消極情感微博數量38063條,占比15.38%。總體上看,積極情感的微博數量多,占比最高,消極情感的微博數量少,占比最低。在積極情感中,一般積極的情感占比最高,可見游客對北京的積極情感主要以輕度的積極情緒為主,高度積極的情感占比相對較少;在消極情感中,一般消極的情感占比最高,高度消極的情感占比最低,極少有極端的負面情緒。這表明絕大部分游客在北京旅游體驗的滿意度較高,大多為正面體驗。

表3 游客情感分布情況

4.3 游客情感語義網絡分析

通過ROST CM6軟件分別對積極情緒和消極情緒的高頻詞進行語義網絡分析,不同節點之間用直線和箭頭表示連接關系。從積極情感語義網絡結構圖(圖1)可以看出,“故宮”“博物院”“天安門”“風景”是圖的核心節點,表明游客來京旅游的主要目的地。“歷史”“文化”“街區”“天氣”等節點屬于次核心節點,表明游客在意旅游景區的歷史文化,同時天氣也是影響游客旅游體驗好壞的因素之一。最外圍的節點中“地鐵”節點相對獨立,可知游客對于交通設施配置的關注。此外,從“好看”“開心”“快樂”“美麗”“好吃”等節點反映了多數游客對于景點及地方美食的滿意。由此可以得出游客的積極情感多表現為贊美、良好體驗、文化豐富等。

圖1 積極情感語義網絡結構

從消極情感語義網絡結構圖(圖2)可以看出,“小吃”“步行街”“地方”“公園”是圖的核心節點,表面景區的屬性和優勢。“遺憾”“可惜”“下次”“再見”等節點反映出了游客消極情緒。從次核心節點“排隊”“時間”

圖2 消極情感語義網絡結構

“小時”反映出游客對于景區排隊時長問題的關注。然而,通過分析原始評論發現,人流量大、景區服務質量欠佳、較差的天氣狀況會讓游客產生負面情感,例如:“人多的漫天遍野,火車站更是個大雜貨鋪令人窒息”“今天的景點總結,又貴又不好玩”“首站長城,鳥巢水立方,實在是太冷了”,由此可以得出游客的消極情感多表現為遺憾、疲憊、失望等。

4.4 游客情感時空熱點分析

本文利用在上述情感值計算結果的基礎上,利用Getis-Ord Gi*方法對游客情感值進行時空熱點分析,得到游客情感冷、熱點空間分布,如表4所示。情感熱點區域主要分布在主城區,在五環內以及六環邊緣均有分布,情感冷點區域主要分布六環以外以及郊區。這表明游客在北京旅游主要選擇在主城區游覽,少部分人選擇到郊區旅游。造成這一現象的原因可能與旅游資源分布有關,因為北京大部分知名景區主要分布于主城區。

表4 情感時空熱點分布區域

5 結論與建議

5.1 結論

本文以北京市的16個市轄區作為案例地,借助新浪微博數據,通過文本分析和空間分析等方法,分析北京游客旅游活動中情感變化的特點和時空規律,體現出以下特點:

高頻詞反映出游客在北京旅游的主要目的地,具有文化和歷史的5A級景區成為游客來京的首選。“打卡”“吃”“走”“拍”和“逛”等高頻詞體現游客旅游的主要旅游活動。“天氣”“好熱”等高頻詞可以看出游客對于天氣的關注以及游客對炎熱天氣的抱怨。“烤鴨”“好吃”等高頻詞可以看出游客對北京特色美食的關注。游客情感表達中存在明顯的正面傾向,正面情感微博數量比負面情感微博數量多。游客的積極情感多表現為贊美、良好體驗、文化豐富等。消極情感主要與人流量大、景區服務質量欠佳、較差的天氣狀況等因素有關。在游客情感值空間分布上,情感熱點區域主要分布在主城區,在五環內以及六環邊緣均有分布,情感冷點區域主要分布六環以外以及郊區。

5.2 發展建議

5.2.1 完善景區規劃與管理

為進一步促進北京游客的積極情緒,在景區開發與管理中應當加強客流管理,以減少游客排隊等候時間,以確保游客旅游體驗質量。加強市場監管,嚴厲打擊宰客行為,及時處理游客投訴。此外,加大景區基礎設施建設,提高景區從業人員素質,為游客提供優質旅游服務。

5.2.2 強化景區特色優勢

從語義網絡分析中可以看出,游客對于北京許多景區展現的歷史、文化內涵的滿意。北京擁有大量傳統文化,應該以文旅融合為突破口,充分挖掘北京中軸線文化、長城文化、紅色文化等資源優勢,豐富游客體驗。此外,培育具有北京特色的旅游產品、旅游線路,打造北京城市旅游名片,不斷豐富旅游產品和服務內容。

5.2.3 引入創新技術應用

景區可以利用數字化智慧平臺、票務系統等,通過智能監控、分流管控、人員疏導等措施,實行限時限量、分流入園接待服務。新技術對可能出現的大客流能夠采取遠端分流限流、近端疏導等防聚舉措,為游客提供放心舒適的游覽環境。將大數據技術應用于旅游投訴的受理、處理,提高服務效率和服務水平,推動旅游景區高質量發展。

猜你喜歡
語義文本旅游
語言與語義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
旅游
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
旅游的最后一天
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
主站蜘蛛池模板: 一本综合久久| 极品国产一区二区三区| 在线观看国产黄色| 成人蜜桃网| 无码精品国产dvd在线观看9久 | 国产精品自在线拍国产电影| 国产青榴视频| 国产乱码精品一区二区三区中文 | 国产成人高精品免费视频| 蜜桃臀无码内射一区二区三区| 国产精品视频观看裸模| 特级精品毛片免费观看| 一本色道久久88| 欧美激情伊人| 国产成人综合久久精品下载| 2020精品极品国产色在线观看| 国产视频大全| 色婷婷综合激情视频免费看| 久久网欧美| 无码高潮喷水在线观看| 成人在线综合| 蜜芽一区二区国产精品| 色欲色欲久久综合网| 国产乱子伦无码精品小说| 亚洲动漫h| 国产男女XX00免费观看| 黄色网站不卡无码| 全裸无码专区| 一级毛片无毒不卡直接观看| 一级一级特黄女人精品毛片| 久久永久免费人妻精品| 麻豆国产精品视频| 一级香蕉人体视频| a亚洲天堂| 亚洲无码日韩一区| 亚洲国产日韩欧美在线| 丁香六月综合网| 亚洲性影院| www.亚洲国产| 亚洲伊人久久精品影院| a毛片基地免费大全| 无码aaa视频| aaa国产一级毛片| 国产成人精品一区二区三区| 久久综合成人| 久草性视频| 久久天天躁狠狠躁夜夜躁| 亚欧成人无码AV在线播放| 欧美啪啪精品| 免费全部高H视频无码无遮掩| 欧美a√在线| 国产高颜值露脸在线观看| 欧美成人免费一区在线播放| 国产91小视频在线观看| 日韩中文无码av超清| 99在线视频免费观看| 免费观看欧美性一级| 亚洲国产午夜精华无码福利| 国产无遮挡猛进猛出免费软件| 亚洲AV无码久久天堂| 美美女高清毛片视频免费观看| 一级一级一片免费| 国产女人综合久久精品视| 国产无码精品在线| 亚洲视频色图| 欧美性色综合网| 欧美在线天堂| 久久免费看片| 五月婷婷综合在线视频| 一本大道无码日韩精品影视 | 制服丝袜亚洲| 国产黄色片在线看| 免费在线一区| 暴力调教一区二区三区| jizz国产视频| 国产精品大尺度尺度视频| 亚洲中文字幕97久久精品少妇| 亚洲区欧美区| 玖玖精品在线| 亚洲黄色成人| 亚洲日本一本dvd高清| 91亚洲国产视频|