999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本挖掘的典型旅游網站的旅游分享研究

2020-04-22 20:31:08林毅焜
價值工程 2020年8期
關鍵詞:文本挖掘

林毅焜

摘要:旅游分享近些年來作為旅游管理研究的新方向,受到很多旅游管理學家的廣泛關注。本文選取四個典型旅游網站——攜程網、馬蜂窩網、去哪兒網、途牛網作為研究樣本,采用文本挖掘的方法,選取四大旅游網站上有關陜西的旅游游記作為研究內容,對游記中的詞頻、情感和語義網絡進行分析。研究結果表明:具有典型旅游符號標記且充滿歷史文化底蘊的景點最受來陜西游客的喜愛。來陜旅游者的情感類型以積極情緒為主,消極情緒所占的比例較小。陜西省旅游景點景區的社交網絡中心度較低,語義社交網絡結構較為松散,一半以上的景點景區對相鄰的旅游資源控制力較小,不存在景點景區集群現象。

Abstract: Tourism sharing, as a new direction of tourism management research in recent years, has received extensive attention from many tourism management scientists. This article selects four typical travel websites-Ctrip.com, Ma.com, Qunar.com, and Tuniu.com as research samples. Using text mining methods, this article selects the travel notes related to Shaanxi in four major travel websites as research content and analyzes the word frequency, emotion and semantic network in travel notes. The research results show that the scenic spots with typical tourist symbols and full of historical and cultural heritage are most popular with tourists from Shaanxi. The sentiment types of tourists coming to Shaanxi are mainly positive emotions, and the proportion of negative emotions is small. The social network centrality of tourist attractions in Shaanxi Province is relatively low, and the semantic social network structure is relatively loose. More than half of the tourist attractions have less control over neighboring tourism resources, and there is no cluster of tourist attractions.

關鍵詞:陜西省;文本挖掘;典型旅游網站;旅游分享

Key words: Shaanxi Province;text mining;typical travel website;travel sharing

中圖分類號:F590.3 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2020)08-0243-05

1 ?研究背景與問題的提出

隨著我國旅游經濟的迅速發展,我國大部分擁有豐富旅游資源的省市希望通過發展其旅游業來促進經濟社會的發展,在此大背景下,新老旅游省份之間的競爭也日益激烈。在互聯網時代,越來越多的旅游者通過查詢旅游網站相關攻略完成旅游過程(游前游中進行旅游景點的確定和服務搜尋,游后進行旅游分享或評價)(田逢軍 2019)。[1]各大旅游網站向旅游者提供將旅游攻略或者點評分享出去,表達自己對旅游地情感態度的途徑,但是各個文本都是分散的,人們只能看到一篇篇攻略卻不能整體了解旅游地的受歡迎程度。旅游地的負面評價也難以整體呈現出來給政府或者景區有關部門進行改正,對旅游者在旅游網站上分享的網絡游記文本進行研究,可以了解旅游者對旅游目的地的需求和偏好。景點通過滿足旅游者的需求增強自身的吸引力。本研究以陜西省為例,通過對各大旅游網站上的互聯網旅游大數據進行挖掘分析,對陜西省網絡旅游形象進行定量評價,找出陜西省旅游業發展的不足之處(王昕天,汪雷 2017)。[2]在此基礎上,提出相應的對策建議,為互聯網時代陜西省旅游發展提供參考。

2 ?國內外旅游分析文獻綜述

自2006年Scott Noel等人系統性定義旅游與酒店業相關知識分享的概念以來。[3]旅游分享一直是國內外學者研究的熱門話題。Lon M J(2009)等指出,旅游者會根據自身對旅游目的地的個人看法,對分享社區的忠誠程度決定是否進行旅游分享行為。[4]Serena Volo(2010)通過搜尋旅游者旅游期間發表的博客對其分享的旅游體驗進行了研究。[5]Park(2012)等對不同國家且不同文化背景的人群進行了調查研究,研究表明文化背景不同的人群采取的旅游分享行為也大不相同,主要體現在分享渠道和形式方面;[6]Anil Bilgihana(2016)等通過研究旅游者在虛擬社區的旅游分享行為中指出實用性感知和誠信感知對旅游者的旅游分享行為有著正向預測作用。[7]近些年來,國內學者也展開基于中國情境下旅游分享的研究。苗學玲(2006)對網絡上各種旅游主帖進行分類研究,研究表明旅游分享帖,經驗帖可以表達旅游者對旅游目的地的偏好和情緒。[8]苗學玲、保繼剛(2007)通過挖掘旅游者在博客、百度貼吧等分享的結伴帖子,研究旅游者在虛擬社區尋找結伴的行為,研究指出分享行為對旅游者結伴旅行有著積極的影響。[9]陳雅茜(2012)采用系統調查的方法對旅游網站發布的相關旅游信息進行搜尋,研究并提出了基于相冊的旅游體驗分享原型系統;[10]歐陽震青、彭潤華(2015)在MOA理論基礎上架構了知識分享模型,研究了旅游者在移動UGC環境下的旅游經驗知識分享行為;[11]胡傳東(2015)等通過對網絡游記文本進行內容分析,對旅游者在風景道上的騎行體驗進行研究。[12]

目前,旅游管理學家主要采用系統調查,問卷調查等較為傳統的方法研究旅游知識分享、體驗分享和虛擬旅游社區分享帖。但傳統旅游調查容易受時間、地點、問卷設計等問題的限制,不能客觀的反應出旅游者的旅游情緒與感受。而網絡游記作為一種網絡文本用于旅游者行為研究時,樣本內容更加真實,提高了研究的信度和效度(張藝鎰,柯彬彬,蘇欣慰 2014)。[13]同時,采用文本挖掘對旅游分享進行研究跟傳統的研究方法相比,前者在抓取數據上具有較大的靈活性。本研究擬采用文本挖掘方法開展典型網站旅游分享研究,為潛在的來陜旅游者提供相應的幫助和對陜西旅游景區的發展決策提供建設性的意見(王耀斌,楊玲,孫傳玲,蔣金萍 2017)。[14]

3 ?研究方法與過程

3.1 典型旅游網站樣本選取

Alexa排名在業界被作為評價網站訪問量的權威指標,基于Alexa排名,本文截取六大典型旅游網站在2019年3月到6月的日均訪問量進行數據收集,數據如表1所示。攜程旅游網是目前國內Alexa排名最高的旅游網站,日均IP瀏覽量達到71.92萬,馬蜂窩旅游網以重視旅游游記分享而著稱,其日均IP瀏覽量占百分比也達到25.37%,飛豬旅游網Alexa排名指標雖然排名第三,但飛豬旅游網的旅游分享游記大多為國外著名景點的分享與本文陜西省文本分析的主題不符合。因此本文舍棄飛豬旅游網作為我們的數據樣本。途牛旅游網日均IP訪問量所占百分比和訪問量都要高于驢媽媽旅游網站,樣本文本的質量也達到我們所需。基于此,本文選取攜程旅游網、馬蜂窩網、去哪兒網、途牛旅游網這四大網站作為獲取旅游分享文本數據的典型網站。

3.2 文本內容的獲取以及處理

本文分別在攜程、馬蜂窩、去哪兒、途牛四大旅游網站上收集和篩選有關陜西省地區及旅游景點景區的游記。在收集游記過程中本文遵循下列三個原則:①剔除網站自身員工以旅游顧問名義發表的一些虛假性文章;②選取的游記內容必須要信息完整并能真實地反映旅游者的旅游體驗與感受,剔除一些僅有少量文字或只有大量照片的游記;③刪除在多個旅游網站重復發表的游記。首先將抓取游記的時間定在2019年1月至2019年12月,利用以上三個原則進行篩選,選取有關陜西省旅游目的地和景區景點的網絡游記共412篇,共11512178字。其次,將收集到的游記文本利用word對進行地名的統一化處理,方便后面數據的處理及分析,如兵馬俑統一名稱為秦始皇兵馬俑、古城墻統一為西安古城墻等。第三為了方便ROST CM 6軟件對文本的識別分析,將修正完成的word文檔轉為txt文本。第四利用ROST CM 6軟件對文本的數據詞頻進行分析,將獲得的詞匯頻數分析結果進行詞匯過濾,篩選過濾出一些游記文本中常見但與旅游者分享的內容無關的表達詞(如:嗎、去哪、在哪等等),提高數據詞頻分析的相關性。

3.3 社會語義網絡中心度

網絡中心度是衡量整個網絡中心化程度的重要指標,中心化程度越高,越容易獲取資源與信息,擁有的權力和影響力就越大。計算公式為:

4 ?研究結果

4.1 網絡游記文本的詞頻整體分析

通過ROST軟件對收集到的網絡游記文本進行高頻特征詞分析,統計得到各旅游網站高頻詞各20個(表2)。從收集到的412篇游記中提取出來的詞匯可以歸納為四個類型。如名勝古跡型(秦始皇兵馬俑、西安古城墻、大雁塔、華清宮)、自然奇觀型(靖邊波浪谷、秦始皇兵馬俑、華山、壺口瀑布)、城市風景型(西安、漢中、古鎮、大唐芙蓉園)、美食型(回民街、小吃)。陜西作為旅游大省,名勝古跡分布集中且各具特色,不僅擁有豐富的自然奇觀型景點旅游區,而且還擁有眾多的紅色景點。還有以西安為代表的古城風光,以回民街為代表的陜西美食,高頻特征詞統計的類型正好印證了這一點。

從表2中詞頻統計可知,詞頻在600以上的數據有7個,其中西安的詞頻為2597,是網絡游記文本中頻數最高的特征詞。西安富集了眾多優質的旅游資源,再加上旅游網站的重點宣傳,使西安成為來陜西旅游的必游之地。歷史的詞頻為828,位居第二,陜西作為文化古都,擁有著一大批歷史文物以及旅游景點,陜西旅游也致力于以歷史、文化悠久來打造其文化旅游品牌。此外西安古城及一些歷史文化建筑進一步加深了旅游者對陜西歷史文化悠久的印象。陜西歷史博物館、華山、西安古城墻、秦始皇兵馬俑、大雁塔五個高頻詞的頻數介于620-810之間,是來陜旅游者關注的熱門旅游景點。事實上,名勝古跡型景觀作為陜西省獨特的旅游文化品牌,已引起了來陜旅游者的濃厚興趣。詞頻介于270-510的中頻特征詞有5個,文化的詞頻最高,表明旅游者對文化旅游的日漸關注和對陜西有較高的文化認同感。近幾年來陜西省著利于利用自身的旅游資源來塑造自身的文化旅游品牌例如以西安古城、大雁塔、華清宮等為代表的西安古城文化,以延安紅色圣地為代表的紅色革命文化。此外,擁有較高知名度的回民街、西安鼓樓、西安鐘樓和華清宮詞頻較低,可能與去景點景區的交通線路過于擁堵或較少、景區配套設施不夠完善、體驗感較差有關。旅游者對回民街、西安鼓樓、西安鐘樓和華清宮旅游的認知較弱。詞頻在245以下的低頻特征詞有8個,有著靖邊波浪谷、延安、秦嶺這些著名景點。可能與景區旅游形式單一、景區內部蘊含的獨特文化內涵沒有得到有效的挖掘有關。秦嶺并非陜西獨有,河南、安徽等省份也在發展秦嶺文化旅游品牌,所以,大多數旅游者對秦嶺旅游的認知程度偏低。整體而言,具有典型旅游符號表征且處于核心資源的名勝古跡型景點最受來陜旅游者的關注。

4.2 旅游網站文本情感分析對比

網絡游記文本情感分析是借助ROST MT6軟件的情感分析功能進行分析。由于中性情緒無法反映出旅游者對旅游目的地的偏好,所以本研究在分析時不考慮旅游者的中性情緒。如表3所示:從整體上來看,共有780條積極情緒所占比例為49.68%,消極情緒158條所占比例為10.7%。整體而言來陜西省旅游者的情感態度大多數以積極情緒為主,表明以陜西省作為旅游目的地對大多數旅游者有著積極的吸引力,這與前面表2旅游文本詞頻分析的結果相符合。從各個網站情感分析來看,途牛網有100條體現旅游者積極情緒的游記詞條,占比98.4%,是四個網站中積極情緒占百分比最多的網站;馬蜂窩網有248條體現旅游者積極情緒的游記文本,占比為45.34%,是四個網站中占比最低的。研究表明:積極情緒在各旅游網站中占比較大。但其中體現旅游者消極情緒的游記文本也同樣存在,且在攜程網、螞蜂窩網和去哪兒網中占有一定比例。螞蜂窩網有74條體現旅游者的消極情緒,數量在所有網站中排名第一,根據該網站的相關游記,有一部分旅游者對陜西省旅游景點相關配套服務以及基礎設施的相對滯后存在著不滿情緒。例如:前往景區的交通線路較少且交通擁擠、景區門票較高。

4.3 典型旅游網站社會語義網絡分析

通過對社交語義網絡多層次進行分析,可以發現隱藏在游記文本中語義信息和剖析語義文本中各部分組成之間的關系(李亞婷,馬費成 2012)。[15]

社會語義網絡中心度分析:借助ROSTCM6軟件以及公式(1)-(3)對陜西省旅游景點進行分析如圖1所示,西安的絕對點度中心度和中間中心度最大,處于社交網絡的核心,說明西安與陜西其他景區相比共現次數最多,與其他景區相比西安富集更多優質的旅游資源,對旅游者的吸引力最大,西安與其他景區相比對臨近旅游資源具有較高的控制力。其次兵馬俑和鼓樓、博物館的絕對點度中心度和中間中心度也較高,處于社交網絡的次核心。資源控制力較弱于西安但高于陜西省其他旅游景點。統計發現,黃河、壺口瀑布、索道、西峰等景點的中心度太低以至于游離在整個圖形外面。西峰、壺口瀑布等,這些景點擁有較高的資源控制力,但這些景點與其他景點的共現的節點較少且缺乏關聯,導致接近中心度較低。

社交語義網絡凝聚子群密度分析:凝聚子群密度能對網絡中小團體現象的嚴重程度進行判斷,密度越接近于1,則旅游景點景區之間小團體現象就越難產生。由圖1可知陜西省的旅游景區之間彼此相互關聯較為松散。社交語義網絡凝聚子群的密度為0.10123,表明陜西省各旅游景點在社會語義網絡中不存在小團體的現象。處于同一子群內的各個景點相互之間聯系較不緊密,再者出現緊密聯系的景點景區大都位于西安市內,同時也反映出陜西省各旅游景點之間的聯系較少。因此,進一步加強各景點之間的交流合作對于未來該景區的發展起著重要作用。

5 ?結論與建議

本文根據旅游者在不同旅游網站分享的有關陜西省旅游景點網絡游記文本進行特征詞頻、情感和旅游景點共現社會網絡圖進行分析,得出以下結論。

從高頻特征詞來看,處于核心旅游資源的名勝古跡景點最受來陜西旅游的旅游者的關注。這一現象的產生與當地獨特的旅游資源基本符合。基于以上的分析,陜西省應該以具有典型符號特征的名勝古跡類旅游景點作為發展旅游業的中心,根據旅游者的網絡游記,進行相關旅游線路的開發設計,發展適應旅客需求的新型旅游線路;其次,應挖掘出旅游景點本身蘊藏的文化與景點的結合,重點打造具有地域特色的文化旅游項目。加深各景點之間的地域協作,使游客可以感受整體的陜西旅游文化。

旅游者關于陜西省的旅游分享情緒以積極情緒為主,消極情緒占比較小。通往景區交通線路不方便、門票價格不合理、景點景區過于商業化、缺乏體驗項目是造成旅游者消極情緒的主要因子。因此,相關景點景區應首先增加通往景區的交通線路,改善景區周圍交通環境。二是在制定門票價格時要充分進行票價調研,選擇大多數旅游者接受的票價進行定價;三是景區增加體驗旅游項目,豐富旅游者的旅游體驗等。

網絡中心度和凝聚子群密度分析表明,陜西省處于核心位置的旅游景點景區較少,處于語義網絡邊緣景點景區較多,且凝聚子群密度低且規模小。這些表明,陜西省大部分旅游景點只能與少部分景點產生聯系,合作范圍較小。陜西省應該將處于核心位置的景區景點重點發展,將低知名度的景點與周圍其他景點景區進行組合,推進大景區的建設,達成景區之間互利共贏的目的。此外,低知名度的旅游景點,在抓大景區建設這一契機的同時,要積極加強自身建設,進一步增強自身的吸引力,陜西省的旅游業將得到巨大提升。

參考文獻:

[1]田逢軍,吳珊珊,胡海勝,田國林,李向明.江西省城市旅游形象的網絡化呈現[J].經濟地理,2019,39(06):214-222.

[2]王昕天,汪雷.基于文本挖掘的在線旅游熱詞情報分析——以攜程網為例[J].情報理論與實踐,2017,40(11):105-109.

[3]Scott Noel, Laws Eric. Knowledge Sharing in Tourism and Hospitality[J]. Knowledge Sharing and Quality Assurance in Hospitality and Tourism, 2006, 7(1)∶1-12.

[4]Lon M J,Hung S, Chen C.Fostering the Determinants of Knowledge Sharing in Professional Virtual Communities[J]. Computer in Human Behavior, 2009,25(4)∶929-939.

[5]Serena Volo. Blogger's Reported Tourist Experiences: Their Utility as a Tourism Data Source and Their Effect on Prospective Tourists[J]. Journal of Vacation Marketing, 2010, 16(4)∶297-311.

[6]Park, Reisinger, Yvette, et al. Cultural Differences in Wed Communication: A Preliminary Study[J]. Tourism Analysis, 2012,17(6)∶761-774.

[7]Anil Bilgihana, Albert Barredab, Fevzi Okumusc, et al.Consumer Perception of Knowledge-sharing in Travel-related Online Social Networks[J]. Tourism Management, 2016, 52(2)∶287-296.

[8]苗學玲.自駕車旅游研究的新視角:旅游網絡論壇的主帖分類研究[J].商業研究,2006,343(11):158-160.

[9]苗學玲,保繼剛.“眾樂樂”:旅游虛擬社區“結伴旅行”之性質研究[J].旅游學刊,2007,22(8):48-50.

[10]陳雅茜.基于相冊的旅游體驗分享技術的研究[J].西南民族大學學報(自然科學版),2012,38(3):462-465.

[11]歐陽震青,彭潤華.移動UGC環境下旅游者知識分享行為研究[J].旅游科學,2015,29(2):47-49.

[12]胡傳東,李露苗,羅尚火昆.基于網絡游記內容分析的風景道騎行體驗研究——以318國道川藏線為例[J].旅游學刊,2015,

30(11):99-107.

[13]張藝鎰,柯彬彬,蘇欣慰.窮游研究——基于網絡文本分析方法[J].未來與發展,2014,38(7):37-39.

[14]王耀斌,楊玲,孫傳玲,蔣金萍.基于文本挖掘的典型旅游網站旅游分享比較研究——以甘肅省為例[J].資源開發與市場,2017,33(01):100-104.

[15]李亞婷,馬費成.基于標簽共現的社會網絡分析研究[J].情報雜志,2012,31(7):103-109.

猜你喜歡
文本挖掘
基于貝葉斯分類器的中文垃圾短信辨識
科技資訊(2017年5期)2017-04-12 15:18:52
基于潛在特征的汽車評論要素挖掘
基于評論信息的淘寶服裝類評分體系優化
商情(2016年32期)2017-03-04 00:27:28
數據挖掘技術在電站設備故障分析中的應用
軟件導刊(2016年12期)2017-01-21 15:55:21
基于LDA模型的95598熱點業務工單挖掘分析
文本數據挖掘在電子商務網站個性化推薦中的應用
商(2016年34期)2016-11-24 16:28:51
從《遠程教育》35年載文看遠程教育研究趨勢
基于文獻的中西醫結合治療腦梗死藥物使用情況分析
基于改進Hadoop云平臺的海量文本數據挖掘
慧眼識璞玉,妙手煉渾金
主站蜘蛛池模板: 91精品网站| 欧美中出一区二区| 国产在线精品香蕉麻豆| 欧美在线视频不卡第一页| 亚洲黄色视频在线观看一区| 婷婷成人综合| 国产一线在线| 爱爱影院18禁免费| 国产成人精品一区二区秒拍1o| 熟妇无码人妻| 美女黄网十八禁免费看| 天堂成人在线视频| 亚洲av无码久久无遮挡| 久久人与动人物A级毛片| 国产欧美日韩另类精彩视频| 一级毛片免费观看不卡视频| 国内精品自在欧美一区| 国产美女在线观看| 欧美在线黄| 四虎AV麻豆| 国产91线观看| 99伊人精品| 国产制服丝袜无码视频| 亚洲精品手机在线| 日本妇乱子伦视频| 亚洲视频无码| 好吊妞欧美视频免费| 国内精品小视频在线| 国产日韩丝袜一二三区| 欧美一级夜夜爽www| 亚洲综合狠狠| 啪啪啪亚洲无码| 欧美在线天堂| 国产福利小视频高清在线观看| 亚洲欧美一区在线| 美女无遮挡免费视频网站| 久久精品国产免费观看频道| 亚洲免费黄色网| 国产成人综合亚洲网址| 亚洲一级毛片免费观看| 蜜臀av性久久久久蜜臀aⅴ麻豆| 青青久久91| 成人在线视频一区| 亚洲国产精品无码AV| 亚洲,国产,日韩,综合一区 | 国产精品视频a| 国模私拍一区二区| 婷婷六月在线| 精品福利网| 国产精品福利在线观看无码卡| 激情综合五月网| 伊人AV天堂| 国产小视频免费观看| 国产自在线播放| 九色国产在线| 国产一区二区影院| 国产亚洲视频免费播放| 国产成人高清精品免费| 国产黄色免费看| 色综合网址| 91精品专区国产盗摄| 亚洲一级毛片在线观| 青青草原偷拍视频| 国产美女人喷水在线观看| 午夜成人在线视频| 最新国产精品第1页| 中文字幕第4页| 亚洲欧美国产视频| 人妻无码AⅤ中文字| 久久99热这里只有精品免费看| 国产白浆视频| 91福利一区二区三区| 亚洲大尺码专区影院| 亚洲国产精品日韩欧美一区| 国产白浆视频| 国产99热| 国模视频一区二区| 在线中文字幕网| 97一区二区在线播放| 91青青草视频在线观看的| 久久国产精品夜色| 国产成人精品一区二区免费看京|