(西北師范大學 旅游學院,甘肅 蘭州 730070)

王耀斌,楊 玲,孫傳玲,蔣金萍
(西北師范大學 旅游學院,甘肅 蘭州 730070)
旅游分享作為旅游研究的新興領域,受到國內外眾多專家學者的關注。選取四大典型旅游網站----攜程網、螞蜂窩網、驢媽媽網和途牛網為研究樣本,以樣本網站上有關甘肅省旅游景區景點的網絡游記為研究內容,采用文本挖掘的方法,對網絡游記中的詞頻、情感和語義網絡進行分析。研究顯示:具有典型旅游符號表征且處于核心旅游資源的自然與人文旅游景點最受來甘旅游者的關注,其中以人文旅游景點最為典型;來甘旅游者的情感類型以積極情緒為主,消極情緒所占比例較小;甘肅省旅游景點的社交網絡中心度較低,1/2以上的景區景點或旅游吸引物對資源不具有控制力,語義社交網絡結構較為松散,不存在派系林立和小團體現象。
文本挖掘;典型旅游網站;旅游分享;甘肅
隨著應用領域的擴大,互聯網逐漸成為人們相互交流信息和外出旅游的重要平臺。大量的旅游者在借助互聯網分享自己的旅游經歷與內心感受的同時,也為潛在旅游者了解相關旅游目的地信息提供了一條更加便捷的途徑。因此,對旅游者的旅游分享進行研究,能更加深入地了解旅游者的旅游偏好,同時對激發潛在旅游市場需求、增強旅游目的地的吸引力有著重要作用。
國外關于旅游分享的研究開始的較早、較成熟,研究成果也較多。Scott Noel等探討了旅游與酒店業相關知識分享的概念及其運用[1]。此后,關于旅游分享的研究成果大量涌現,研究范圍也在不斷擴大。Lon M J等指出,決定旅游者在虛擬社區進行旅游分享的因素與旅游者的個人看法、分享行為和社區忠誠度有關[2];Serena Volo以旅游者的博客為資料來源,對旅游者分享的旅游體驗進行了評價[3];Park等研究了不同文化背景下的旅游者信息分享行為[4];Anil Bilgihana等借助旅游社交網絡,研究了消費者對旅游知識分享的感知行為,指出實用性感知和誠信感知對分享行為有著積極的影響[5]。與國外相比,國內對旅游分享的研究較晚,研究成果主要集中在旅游知識分享、旅游體驗分享、旅游虛擬社區分享等方面。苗學玲對旅游網絡主帖進行了研究,確立了分類體系,指出分享帖是主要類型之一[6];保繼剛、苗學玲采用扎根理論,借助旅游者在虛擬社區分享的結伴帖子,探討了在互聯網平臺上尋找“游伴”的現象,揭示了分享是旅游者選擇結伴旅行的原因之一[7]。此外,王婷婷采用定性與定量的分析方法,研究了旅游虛擬社區的分享帖并提出了改進建議[8];陳雅茜利用系統調查的方式,以旅游相關信息為對象,重點研究了旅游體驗的分享技術,并提出了基于相冊的旅游體驗分享原型系統[9];歐陽震青、彭潤華運用MOA(Motivation Opportunity Ability)理論和知識分享模型,研究了移動UGC(User Generated Content)環境下旅游者的知識分享[10];胡傳東等利用內容分析法,對游客分享的騎行體驗進行了研究[11]。
總體來看,所有這些研究為旅游分享研究做出了較大貢獻,研究者主要采用傳統的方法研究旅游知識分享、旅游體驗分享和虛擬旅游社區分享帖。事實上,網絡游記作為一種網絡文本用于旅游者行為研究時,可在一定程度上避免傳統旅游調查中受時間、地點、問卷設計等問題的限制,樣本內容更加真實地反映旅游者的主觀感受[12],因此對典型網站的旅游分享研究有著重要價值。同時,數據挖掘中的文本挖掘方法,較傳統常用的旅游分享研究方法而言,在不規則問題處理中優勢十分明顯。本研究擬采用數據挖掘中的文本挖掘方法,選取國內典型網站作為研究樣本,以網站上旅游者發表的有關甘肅省旅游景區景點的游記為研究內容,開展典型網站旅游分享比較研究,旨在為潛在的來甘旅游者和區域旅游發展決策提供參考服務。
2.1 典型旅游網站樣本選取
作為評價某一網站訪問量的重要指標,Alexa排名提供了包括綜合排名、到訪量排名、頁面訪問量排名等多個評價指標信息。基于Alexa排名的功能,本文選取旅游者發表旅游游記較多的旅游網站作為研究樣本,即攜程旅行網、螞蜂窩旅游網、途牛旅游網和驢媽媽旅游網。攜程旅游網是目前Alexa排名最高的綜合性旅游網站,日均IP訪問量達216萬人次[13];螞蜂窩旅游網是中國領先的旅游社交網站,也是目前國內較大的旅游分享網站,旅游社區近月訪問量達94.94%[13];驢媽媽作為中國自助游資訊服務平臺,近月網站訪問比例達94.57%[13];擁有全球最大中文景點目錄和中文旅游社區的途牛旅游網,日均網站頁面瀏覽量達261.6萬人次[13]。基于此,本文選取這四大網站作為研究旅游分享的典型網站。
2.2 文本內容的獲取與處理
分別在選取的攜程、驢媽媽、螞蜂窩和途牛四大國內旅游網站上進行收集和篩選有關甘肅省旅游目的地以及景區景點的游記。在篩選獲取文本內容的過程中遵循三條原則:①識別網絡游記的真實性,剔除一些為商家宣傳旅游景點、路線與酒店而撰寫的有關酒店體驗與航班感受的游記;②選取的游記內容必須要信息完整并能真實地反映旅游者的旅游體驗與感受;③刪除一些旅游者在多個網站重復發表的游記。遵循上述三條原則,首先將研究時間段定為2013年4月到2015年12月。經過篩選,在選取的典型旅游網站上收集有關甘肅省景區景點的網絡游記80篇,共112970字。其次,按照網站名稱將收集的網絡游記分為4個word文檔,利用word軟件對收集到的相關資料進行處理,將數據中同一旅游景點的多個表達名稱進行統一,如雅丹在數據中指雅丹國家地質公園。第三,為了便于分析軟件的識別,將修正完成后的word文檔全部轉化成txt文件格式并保存。第四,利用ROST CM 6軟件對數據詞頻進行分析,將獲得的初步分析結果進行詞匯過濾處理,將“這些、去哪、的、嗎”等一些旅游游記中常見但與旅游者分享無關的詞匯納入軟件詞匯表;利用ROST軟件的過濾功能,過濾無意義的詞匯,提高數據詞頻分析的相關性,從而完成以甘肅省為例的四大典型旅游網站的旅游分享比較研究。
2.3 社交語義網絡中心度
網絡中心度是衡量整個網絡中心化程度的重要指標,中心化程度越高,越容易獲取資源與信息,擁有的權力和影響力就越大。計算公式為:
(1)
式中,CD(ni)為點度中心度,Rij為節點的聯系強度。若Rij=0,表明節點i與節點j之間沒有關聯;Rij=1,表明節點i與節點j之間相互關聯。
中間中心度測量節點位于網絡圖中其他節點中間的程度,計算公式為:
(2)
式中,CB(ni)為中間中心度,gjk為節點j到節點k的最短路徑數。若CB(ni)=0,表明該節點不具有對其他節點的控制力;若CB(ni)=1,表明該節點處于網絡的中心位置,完全可以控制其他節點。
接近中心度能衡量網絡中各節點之間的距離,節點的中心度越高,與其他節點的聯系就越緊密,計算公式為:
(3)
式中,CC(ni)為接近中心度,d(ni,nj)表示節點i與節點j之間的距離。
3.1 網絡游記文本內容詞頻整體分析
依據研究方法,統計獲得典型旅游網站旅游分享所使用的高頻特征詞共20個(表1)。從表1可見,旅游者分享的網絡游記中最終提取的有關甘肅省旅游目的地的詞匯主要是體現旅游景點和旅游吸引物的名詞,旅游目的地詞匯可歸納為四種類型:地質地貌型(丹霞、雅丹、沙漠、戈壁、冰川)、自然風光型(草原、景觀、黃河、月牙泉、鳴沙山)、城市風貌型(蘭州、張掖、夏河、敦煌、嘉峪關、玉門關)、名勝古跡型(莫高窟、馬蹄寺、拉卜楞寺、洞窟、壁畫、石窟)。甘肅作為旅游資源大省,地質地貌景觀分布集中且獨具特色,不僅擁有濃郁的民族風情和眾多的紅色勝跡,還擁有以敦煌為代表的佛教圣地、以夢柯冰川為代表的冰川雪山和以甘南草原為代表的草原綠洲,高頻特征詞統計的類型正好印證了這一點。
從表1統計的高頻特征詞的頻數可知,詞頻在140以上的高頻特征詞有7個,其中敦煌的詞頻為298,是樣本總體中頻數最高的特征詞,說明敦煌被旅游者提及的次數最多,最受旅游者的關注。敦煌富集眾多優質的旅游資源,世界知名度較高,加之各大旅游網站的重點宣傳,使敦煌成了來甘旅游的必游之地。蘭州的詞頻為194,列居第二。作為黃河唯一穿城而過的城市,蘭州可為旅游者提供西北特有的感官享受。此外,中山橋、黃河母親像等眾多標志性景觀進一步加深了旅游者對蘭州旅游的印象。莫高窟、鳴沙山、丹霞、雅丹、張掖七個高頻特征詞的頻數介于140—170之間,是旅游者較為關注的熱門旅游景點。事實上,作為甘肅省獨特的旅游資源,地質地貌類景觀已引起來甘肅旅游者的極大興趣,成為來甘肅旅游者觀光游覽的重要組成部分。詞頻在90—120之間的中頻特征詞有6個,其中黃河的詞頻相對較高,表明近年來部分旅游者開始關注黃河旅游,但黃河并非甘肅的特有,青海、河南等地也在打造黃河文化旅游品牌,相對于前面的7大高頻詞而言,旅游者對黃河旅游的認知較弱。此外,擁有較高知名度的月牙泉未出現在高頻之列,可能與景區娛樂單一、價格昂貴、體驗程度較低等有關。中頻詞中出現了沙漠、駱駝這兩個甘肅典型符號特征的詞匯,表明沙漠旅游逐漸受到旅游者的青睞。對大多數旅游者而言,在沙漠中乘坐駱駝觀看日出、日落將是一種珍貴的旅游體驗與經歷。詞頻在90以下的低頻特征詞有7個,玉門關、嘉峪關等知名景點位列其中,由于景區蘊含的深厚文化內涵沒有得到很好的挖掘、旅游特質單一等原因,較高的知名度并沒有引起旅游者的極大興趣。甘南旅游景點拉卜楞寺在樣本總體中出現頻數為67次,在樣本總體中排名最低。由于甘南的旅游景點大都以自然景點為主,季節性明顯,使來甘南旅游的游客數遠低于甘肅中西部其他旅游景點。整體而言,具有典型旅游符號表征且處于核心資源的自然與人文旅游景點最受來甘旅游者的關注,其中以人文旅游景點最為典型。

表1 典型網站游記文本內容高頻特征詞統計
3.2 樣本網站高頻特征詞的對比分析
從表1可知,在高頻特征詞中,敦煌不但在樣本總體中排名最高,而且是各典型旅游網站都存在的熱門景點。敦煌因莫高窟這一世界文化遺產而享譽中外,受到旅游者的普遍關注,使旅游者形成一種“游甘肅必去敦煌”的意識觀念。莫高窟在樣本總體中列第三位,在驢媽媽網中則列第十七位。未進入樣本總體前20名的拉卜楞寺、拱北,在驢媽媽網中分別列第四位、十四位。據統計,驢媽媽旅游網約有55%的旅游者以“自由行”為主要出游方式,在空間景點選擇上具有更多的自主性,這部分旅游者更加青睞那些被團隊游所忽略的景點。此外,同樣出現在樣本高頻序列的雅丹,在驢媽媽網中則列第十四位。在中頻特征詞中,黃河在樣本總體的中頻序列中排名最高,在螞蜂窩、途牛網站中則未進入高頻特征詞的前20名。其次,位居樣本總體中頻序列第二位的地貌,在途牛中列第十七位,表明與傳統旅游景點相比,這兩大網站更加關注一些新奇景點。出現在樣本總體低頻序列中的玉門關,是各典型網站排名較低的特征詞;其次是嘉峪關,在攜程、驢媽媽中同樣排名較低,在螞蜂窩中則未出現。關于嘉峪關的旅游分享,一旅游者在螞蜂窩網站上寫道:“嘉峪關只是一座古建筑讓我有點失望。”表明玉門關和嘉峪關景區雖然蘊含豐富的文化內涵,但對以娛樂體驗為主的旅游者而言,單一的觀光特點難以對廣大游客形成吸引力。各樣本網站高頻特征詞的對比分析表明,來甘肅旅游者的旅游分享不但與各典型網站的主營業務有關,而且與旅游景點的自身特色和景觀組合狀況有關。
3.3 典型網站游記文本情感對比分析
網絡游記文本情感分析是在網絡游記詞頻分析的基礎上,借助ROST MT6軟件的情感分析功能進行分析。如表2所示(由于中性情緒無法反映旅游者對旅游目的地的偏好,所以本研究主要分析旅游者的積極與消極情緒):從總體上看,共有972條體現旅游者的積極情緒,占61.91%;消極情緒所占比例較小,為19.49%。即來甘肅旅游者的情感態度以積極情緒為主,表明甘肅省作為旅游目的地對游客具有較高的旅游吸引力,這一現象與表1網絡游記詞頻表的分析結果相吻合。從各類網站呈現的旅游者情感類型來看,驢媽媽網有303條體現旅游者的積極情緒,占59.88%,是旅游者體現積極情緒最多的旅游網站。其次,螞蜂窩旅游網中有249條體現旅游者的積極情緒,占59.15%。攜程網則有205條體現旅游者的積極情緒,是所有網站中體現旅游者積極情緒最少的網站。經過分析表明,積極情緒在各分類網站中有著較為明顯的優勢。此種狀態與各網站所追求的理想宣傳效果相一致,但其中的消極情緒同樣存在,且在攜程網、螞蜂窩網和途牛網中占有較高的比例。尤其是螞蜂窩網,有96條體現旅游者的消極情緒,數量在所有網站中排名第一,這一現象的出現與甘肅省旅游基礎設施相對滯后是分不開的。根據旅游者的相關游記,有相當一部分旅游者因對市內交通擁擠、景點門票較高而存在著不滿情緒,這是值得重視的。

表2 典型網站游記文本情感分布
3.4 典型旅游網站社交語義網絡分析
分析社交語義網絡圖能有效地判斷組成該網絡的結構體系,了解網絡隱藏的語義信息以及各組成部分之間的關系,并且能從多個角度分析事態的全局狀況[14]。
社交語義網絡中心度分析:借助UCINET軟件與式(1)—(3)對甘肅旅游景區景點等的社交語義網絡中心度進行分析(表3)。由表3可知,敦煌的絕對點度中心度最大,處于社交語義網絡的核心位置,說明敦煌與甘肅省其他旅游景點和旅游吸引物相比共現次數最多,對旅游者的吸引力最大。其次,莫高窟、地貌、雅丹的絕對點度中心度也較高,處于社交網絡的次核心。此外,由于景點之間的關聯性較低,僅有52.54%的景點中心度在零度以上。中間中心度統計結果顯示,敦煌是整個社交語義網絡中間中心度最高的景點,表明該地富集大量的旅游資源,且擁有較高的資源控制力。其次,鳴沙山、雅丹、地貌、莫高窟的中間中心度也相對較高,資源控制力較弱于敦煌但高于甘肅省其他旅游景點。統計發現,甘肅省景點中間中心度在零度以上的有21個,占總體的17.65%,即有1/2以上的景區景點或旅游吸引物對資源不具有控制力。從整體來看,中間中心度較高,點度中心度和接近中心度較小。例如,鳴沙山、丹霞等,這些景點擁有較高的資源控制力,具有一定的旅游吸引力,但由于這些景點共現的節點缺少與其他景點的相互關聯,導致接近中心度較低。

表3 社交語義網絡中心度分析結果(部分)
注:由于點出度與點入度相同,本文只對點入度進行統計。
社交語義網絡凝聚子群密度分析:凝聚子群密度能對網絡中小團體現象的嚴重程度進行判斷,與派系林立程度密切相關,密度越接近于1,則派系林立的程度就越大,小團體或抱團現象就越難產生[15]。由樣本游記中甘肅省各景點構成的社交語義網絡圖見圖1。

甘肅省內的旅游景點或旅游吸引物之間彼此相互關聯較松散。甘肅省旅游景點所構成的社交語義網絡凝聚子群的密度為0.0302,較低的凝聚子群密度表明甘肅省各旅游景點在社交語義網絡中不存在派系林立和小團體的現象。處于同一子群內的各個景點相互之間聯系較松散,在一定程度上很難出現抱團現象,同時也反映出甘肅省各旅游景點之間的聯系較少。因此,加強各景點之間的交流合作對甘肅省旅游業發展而言尤為重要。
根據有關甘肅省旅游景點網絡游記文本,對不同旅游網站旅游者分享的游記進行特征詞頻、情感和旅游景點共現社會網絡圖進行分析,得出以下結論。
從高頻特征詞來看,具有典型旅游符號表征且處于核心旅游資源的自然和人文旅游景點最受來甘肅旅游的旅游者的關注,其中以人文旅游景點最為典型。這一狀況與甘肅省各旅游目的地所具有的資源特色和相關組織所追求的營銷宣傳效果基本符合。基于此,甘肅省應以具有典型符號表征的人文旅游地為中心,根據游客的旅游分享,進行相關旅游產品的開發設計,促進旅游產品向多元化轉化;其次,應加快特色文化與創意產業的結合,在兼顧娛樂性與體驗性的同時,重點打造具有地方和區域特色的文化旅游項目,培育甘肅特色旅游品牌,完善各景點之間的地域協作,逐步推動單一觀光旅游向復合型旅游轉變。
旅游者關于甘肅省的旅游分享情緒以積極情緒為主,消極情緒占比較小。對來甘肅旅游者的消極情緒分析表明,交通擁擠、門票價格過高、“旅大于游”、體驗項目的缺乏是造成旅游者消極情緒的主要因子。因此,旅游目的地應首先改善道路交通環境,完善道路交通基礎設施,對旅游者進行合理疏導,避免出現過度擁擠現象;二是在制定門票價格時要充分考慮大眾旅游者的經濟承受能力,適時推出門票優惠政策或免門票的知名旅游景點;三是增加具有旅游目的地特色的體驗旅游項目,豐富旅游者的旅游體驗等。
網絡中心度和凝聚子群密度分析表明,甘肅省旅游景點處于核心位置的較少,處于網絡邊緣的景點較多,且凝聚子群的規模較小、密度較低。這種狀況表明,甘肅省各景點與景點之間的溝通合作范圍較小,大部分旅游景點只與少數的旅游景點有連接關系。在實踐中,甘肅省應將處于核心位置的景區景點作為未來打造特色旅游目的地品牌、構建旅游目的地形象的核心關注點。積極推進大景區建設,進行景區資源整合,在突出重點的前提下將低知名度的邊緣景點與高知名度的景點進行組合,既能實現景區雙贏的目的,又能很好地擴大景區之間的合作范圍。此外,低知名度的邊緣景點,在搶抓大景區建設這一契機的同時,要積極加強自身建設,主動與知名度高的景區景點展開合作,不但能有效提升景區自身知名度,而且還能有效避免其他景點的排擠。
[1]Scott Noel,Laws Eric.Knowledge Sharing in Tourism and Hospitality[J].Knowledge Sharing and Quality Assurance in Hospitality and Tourism,2006,7(1)∶1-12.
[2]Lon M J,Hung S,Chen C.Fostering the Determinants of Knowledge Sharing in Professional Virtual Communities [J].Computer in Human Behavior,2009,25(4)∶929-939.
[3]Serena Volo.Blogger′s Reported Tourist Experiences:Their Utility as a Tourism Data Source and Their Effect on Prospective Tourists[J].Journal of Vacation Marketing,2010,16(4)∶297-311.
[4]Park,Reisinger,Yvette,etal.Cultural Differences in Wed Communication:A Preliminary Study[J].Tourism Analysis,2012,17(6)∶761-774.
[5]Anil Bilgihana,Albert Barredab,Fevzi Okumusc,etal.Consumer Perception of Knowledge-sharing in Travel-related Online Social Networks[J].Tourism Management,2016,52(2)∶287-296.
[6]苗學玲.自駕車旅游研究的新視角:旅游網絡論壇的主帖分類研究[J].商業研究,2006,343(11)∶158-160.
[7]苗學玲,保繼剛.“眾樂樂”:旅游虛擬社區“結伴旅行”之性質研究[J].旅游學刊,2007,22(8)∶48-50.
[8]王婷婷.基于內容分析的旅游虛擬社區分享帖研究[D].九江:江西師范大學碩士學位論文,2012∶20.
[9]陳雅茜.基于相冊的旅游體驗分享技術的研究[J].西南民族大學學報(自然科學版),2012,38(3)∶462-465.
[10]歐陽震青,彭潤華.移動UGC環境下旅游者知識分享行為研究[J].旅游科學,2015,29(2)∶47-49.
[11]胡傳東,李露苗,羅尚火昆.基于網絡游記內容分析的風景道騎行體驗研究——以318國道川藏線為例[J].旅游學刊,2015,30(11)∶99-107.
[12]張藝鎰,柯彬彬,蘇欣慰.窮游研究——基于網絡文本分析方法[J].未來與發展,2014,38(7)∶37-39.
[13]Alexa 網站排名查詢[DB/OL].http://www.alexa.cn/,2016-02-23/2016-03-08.
[14]李亞婷,馬費成.基于標簽共現的社會網絡分析研究[J].情報雜志,2012,31(7)∶103-109.
[15]廉同輝,余菜花,宗乾進.我國旅游網站的網絡結構研究——基于社會網絡分析法[J].旅游科學,2012,26(6)∶80-88.

WANG Yao-bin,YANG Ling,SUN Chuan-ling,JIANG Jin-ping
(Tourism College,Northwest Normal University,Lanzhou 730070,China)
As a new field of tourism research,travel sharing attracted the attention of many experts and scholars in China and aboard.Selected Taking Sconic Spots Gansu Province as an example,the ctrip,mafengwo,lvmama and tuniu travel websites were as research sample,using the text mining method to analyze the word frequency,emotion and semantic website.The results showed that tourists were most concerned with the characterization of typical tourist signs and at the core of tourism resources of the natural and humanistic attractions,especially in the humanities was the most typical.From the perspective of emotion type,positive emotion dominated in emotional components,negative emotion accounted for a small proportion.As a tourist destination,Gansu Province had a high tourism attraction to tourist.But the negative factors that affected the emotion of tourists,such as infrastructure lag,traffic congestion and ticket price were too high which could not be ignored.Furthermore,more than half of the scenic spots or tourist attractions had no power for resources.Finally,the centrality of semantic website of scenic spots was low and structure of semantic website was relatively loose,so there was no factionalism and small group phenomenon.In addition,in the same subgroup of the various attractions were not connect too good.To same extent,the huddle phenomenon was difficult to appear,and it also reflected the connect between the various attractions in Gansu Province which was very seldom.Therefore,it was particularly important to strengthen the communication and cooperation among the attractions in Gansu Province.
text mining;typical travel website;tourism sharing;Gansu Province
2016-11-17;
2016-12-24
國家自然科學基金項目“粗糙集與模糊集結合的民族地區鄉村旅游扶貧精準識別研究”(編號:41661107);國家旅游局旅游業青年專家培養計劃項目“主客雙重感知視角的民族地區旅游影響模型構建與實證”(編號:TYEPT201453);西北師范大學人文社科骨干項目(編號:SKGG14024)。
及通訊作者簡介:王耀斌(1976-),男,甘肅省會寧人,副教授,碩士生導師,研究方向為區域旅游、旅游影響。
F590.3
A
1005-8141(2017)01-0100-05