劉雨菲,李云鵬,許 靖
(1.首都經濟貿易大學,北京 100070; 2.北京清博大數據科技有限公司,北京 100191)
近年來,網絡搜索數據、輿情數據為旅游研究提供了重要的數據來源,基于這些數據的網絡關注度研究成為許多旅游研究學者的研究內容,如:文捷敏[1]對烏鎮民宿的網絡關注度時空特征及影響因素進行分析,張茜[2]發現特色小鎮數量和國內生產總值是影響其網絡關注度的重要因素,許廣路[3]通過百度指數分析南京市核心景區網絡關注度時空特征,方葉林等[4]研究了網絡關注度與游客量之間的關系并進一步分析其中的內部機理并提出對策建議。全域旅游作為國家戰略,對于旅游目的地長期發展具有重要意義,也是促進旅游業高質量、可持續發展的需要。2019年確立了首批國家全域旅游示范區,對旅游目的地建設起到了引領與帶動作用。北京作為首都旅游需求量大且京郊地區具有多種不同業態的旅游資源,可以在一定程度上滿足不同消費需求的旅游者。隨著全域旅游示范區項目的落實,將區域整體作為旅游目的地發展,實行產業融合,使得延慶、懷柔、平谷三地的旅游吸引力不斷增強,同時引導了京郊城鎮、鄉村的一體化建設,促進了旅游產業鏈條各要素的融合。
以北京市延慶區、平谷區、懷柔區為例,結合網絡公開數據對信息進行提取和挖掘,以景區、住宿、節慶活動為研究維度,綜合輿情現狀對三個地區進行評價和分析。基于大數據視角,力求“競對分析”評價結果客觀且科學(競對分析是指根據關鍵詞搜索結果分析三個地區的數據總量、趨勢對比、平臺分布、情感分布、熱門主題詞、發布地區、活躍渠道和熱門文章并進行對比),為今后旅游融合發展提供一定的參考。
以北京全域旅游示范區為研究對象,利用百度指數,收集近幾年三地的網絡關注度變化規律,同時通過各大網站收集并確定延慶、平谷、懷柔三個區縣住宿、景區、節慶活動的熱點內容,借助百度指數和清博輿情系統對2020年疫情期間網絡公開數據進行抓取和分析,能夠更加全面和精準地抓取到需要的信息,做到及時了解行業動向,隨時掌握各大網站消息,實現負面輿情第一時間預警。由于24小時實時對全網進行輿情檢測,因此能夠及時有效地分析信息并研究其發展趨勢。
利用百度指數進行關鍵詞比較檢索,研究過去對于三地網絡關注度的變化規律,同時利用清博平臺輿情分析系統對疫情下2020年6—8月的關鍵詞進行競對分析,了解旅游者的偏好和市場未來發展趨勢,提供相關數據支撐,促進北京全域旅游發展。其中,關鍵詞提取是指找到能夠表現研究對象特征的熱點詞語,以微博信息為主,包括在小紅書、馬蜂窩等旅游相關熱門應用軟件和網站進行提取。定位在延慶、平谷、懷柔三個區縣,分別對其住宿、景區、節慶活動三個不同維度進行關鍵詞抓取,并將其適當組合輸入清博輿情系統進行分析和處理。三地關鍵詞提取如表1~3所示。

表1 延慶關鍵詞提取Tab.1 Key words in Yanqing

表2 平谷關鍵詞提取Tab.2 Key words in Pinggu

表3 懷柔關鍵詞提取Tab.3 Key words in Huairou
根據關鍵詞提取進行分析詞組的組合,排除歧義詞,以確保搜索結果的準確性。系統生成競對報告,其內容包括平臺來源、情感態度、熱門主題詞、發布地區、活躍渠道和熱門文章。其中,平臺來源包括網頁、微信、微博、APP、論壇、報刊、視頻、頭條號、搜狐號、問答、評論以及其他類型。情感分布主要包括正面、負面和中性的態度。
以“延慶”“平谷”“懷柔”為關鍵詞,分別獲取2017—2019年均搜索指數,得到圖1~3。對三個地區網絡關注度趨勢進行分析和統計,延慶和懷柔地區的網絡關注度高于平谷地區,兩地中延慶關注度略高,但差距較小。由圖1~3發現近幾年變化趨勢有一定的規律性,如三個地區關注度較高的小波峰均出現在4、5、8月,關注度較低的波谷出現在1、2、12月。

圖1 2017年延慶、平谷、懷柔月均關注度趨勢Fig.1 Monthly attention trend of Yanqing, Pinggu and Huairou in 2017

圖2 2018年延慶、平谷、懷柔月均關注度趨勢Fig.2 Monthly attention trend of Yanqing, Pinggu and Huairou in 2018

圖3 2019年延慶、平谷、懷柔月均關注度趨勢Fig.3 Monthly attention trend of Yanqing, Pinggu and Huairou in 2019
截止2020年8月,對于本年度網絡關注度進行統計并分析其變化,通過圖4可以發現,由于受疫情影響,2020年1—8月延慶、平谷、懷柔地區的網絡關注度整體同比去年時間段有不同程度下降,但隨著疫情的不斷好轉,網絡關注度環比在逐漸提高,預計未來關注度仍有持續上漲趨勢。

圖4 2020年1—8月延慶、平谷、懷柔月均關注度趨勢Fig.4 Monthly attention trend of Yanqing, Pinggu and Huairou from Jan. to Aug. 2020
針對關鍵詞提取北京三個首批國家全域旅游示范區,從產業發展的三個不同維度進行評價分析。關鍵詞提取時間為2020年6月1日—8月24日,分析延慶、平谷、懷柔三個地區的住宿、景區、節慶活動狀況,其內容包括趨勢對比、情感態度、熱門主題詞等。如表4,將關鍵詞進行組合以及歧義詞的排除后,根據不同地區三個維度的信息量進行匯總。

表4 信息數據總量Tab.4 Information data gross
2.2.1 趨勢對比
本研究數據獲取時間為2020年6月1日—8月24日,所使用的數據為清博輿情系統抓取的網絡公開數據。除個別時點突發事件影響,從綜合指數變化來看,隨著疫情的緩解與好轉,從7月中旬開始,三個地區的信息量均高于6月份的信息量,且延慶的旅游產業從住宿、景區、節慶活動三個方面總體熱度均較高,信息量普遍高于懷柔和平谷兩地,其中各類趨勢對比的波動受到節假日或相關活動影響較大。如延慶,8月8日的景區類、節慶活動類達到峰值是由于推出了“夜游八達嶺”活動,因此達到信息量高峰,引起熱議。住宿類、景區類、節慶類趨勢對比如圖5~7所示。

圖5 住宿類趨勢對比Fig.5 Comparison of accommodation trend

圖6 景區類趨勢對比Fig.6 Comparison of scenic spots trend

圖7 節慶活動類趨勢對比Fig.7 Comparison of festival activities trend
2.2.2 情感態度分析
在網絡公開數據中,將情感態度分為正面、負面和中性三種。通過敏感詞語出現的頻次等在后臺進行評估,并綜合計算結果。正面態度指對于該內容有明顯贊揚和支持的情感傾向;負面態度指有明確的否定和批評態度,可設置預警狀態;中性態度指沒有明確肯定或否定的情感傾向,多以表達自己客觀公正的觀點為主。
根據分類結果,對三個維度的情感態度加權平均得到圖8。從信息匯總可以看出,其情感態度分布主要以中性為主,正負面情感有一定差距,但影響較小。延慶、平谷地區對于旅游產業三個維度的情感更為鮮明,因為其正面態度比例較高,負面傾向較小,所以游客整體滿意度較高。懷柔地區負面情感高于其他兩地,其中住宿和景區的正負面態度基本持平,可以看出該地旅游仍有需提高的部分。
2.2.3 熱門主題詞分析
熱門主題詞主要從傳播分析的角度展現了研究的重點關注對象和核心詞匯。圖9以延慶、平谷、懷柔在旅游網絡公開數據中提取的關鍵詞為例,可見在近期網民主要關注的內容為北京、北京市、疫情、文化、項目,通過關注度較高的詞匯可以進行有針對性的營銷和宣傳[5]。

圖8 情感分布Fig.8 Emotion distribution

圖9 延慶、平谷、懷柔旅游熱門主題詞Fig.9 Popular tourism subject terms of Yanqing, Pinggu and Huarou
根據競對報告分析得出:延慶,住宿中提及較高頻次的詞語為北京、延慶、民宿、度假村、凈隱;景區類為北京、景區、文化、八達嶺長城、百里畫廊;節慶活動類為北京、文化節、世界園藝博覽會、八達嶺長城、冬奧會。平谷區,住宿類熱點主題詞為北京、平谷、疫情、民宿、特色、精品;景區類為北京、景區、平谷、金海湖、風景區;節慶活動類為北京、平谷、世界、大會、主會場。懷柔區,住宿熱點主題詞為北京、長城、懷柔、民宿、鄉村;景區類為北京、長城、慕田峪長城、紅螺寺、雁棲湖;節慶活動類為北京、國際、電影節、主題、電影。
全域旅游背景下,延慶區以世園會、冬奧會為主,借此契機優化升級高星級酒店、高端民宿以及度假村,帶動旅游經濟增長,同時以八達嶺長城作為熱點景區,打造長城文化,組織各類相關活動不斷提高網絡關注度。平谷區作為桃鄉,有豐富的果園及農業休閑園發展經驗,以世界休閑大會及相關節慶活動作為引領,推動休閑之都發展。懷柔區以雁西湖作為國際會議舉辦地,通過影視產業示范區不斷增進國際交往和影視文化交流,同時也以推動鄉村旅游升級為主,不斷提高民宿品牌建設。
通過對近幾年的數據分析得知,延慶、平谷、懷柔地區的網絡關注度基本持平,而今年受到疫情的影響,關注度同比略有下降,在此期間三地也在通過各種方式不斷提高產品質量水平。結合關鍵詞抓取,北京三個全域旅游示范區展現出了文旅融合、生態旅游、休閑旅游的創新發展,并不斷走入國際視野,對全國各地深化全域旅游具有重要的借鑒意義。
綜合以上網絡公開數據分析可以看出,延慶區在住宿、景區、節慶活動三個維度上整體數據水平都遠高于懷柔和平谷兩地,尤其是節慶活動的數據量,其中熱點詞為世園會和冬奧會。因此,延慶以世園會和冬奧會的舉辦為契機,加上長城景區,打造三大世界IP,不斷提升全域旅游的配套基礎設施,推動精品民宿發展,打造全域旅游國際形象。平谷地區借助世界休閑大會的舉辦以及相關節慶活動,如桃花節、采摘節、馬拉松等,并不斷出臺多種政策推動鄉村生態旅游,全力打造全域休閑旅游目的地。但從關鍵詞抓取以及熱點詞匯中可以看出,平谷地區在住宿維度上內容較少且整體質量不高,多以中低端快捷酒店和農家院為主,高端民宿數量較少。因此,可以通過“共享經濟”的方式,推動平谷地區住宿水平整體提升[6]。懷柔地區以雁棲湖的國際會都為引領,將國際電影節的影視文化與旅游相結合,以慕田峪長城5A級和其他4A級景區為支撐,住宿類熱點詞主要為民宿和鄉村。懷柔一直出臺各類政策和標準致力于推動鄉村旅游經營者向高端發展并打造“懷柔民宿”品牌,從而促進全域旅游發展。但從關鍵詞的情感態度分析中看出,其負面比例大于其他兩個地區。在提取負面信息后發現,由于長城邊暗開收費棧道,周邊水體遭到污染導致。因此,懷柔地區需要加強旅游管理,完善相關監管制度,提高旅游景區及其周邊的形象。
基于百度指數和輿情系統對網絡關注度進行競對分析,對北京全域旅游示范區有著重要的參考價值。綜合北京三個區縣的全域旅游發展整體進行分析可以得出,產業結構和產品質量仍是未來需要突破和發展的方向。北京延慶、平谷、懷柔各地擁有多種不同業態,服務于不同消費需求的旅游者,疫情期間雖為旅游按下了暫停鍵,但這也正是提升產品結構和質量的良機。
在網絡公開數據下,根據前幾年旅游市場的發展規律,對北京市首批全域旅游示范區延慶、平谷、懷柔進行競對分析,從產業發展的住宿、景區和節慶活動三個維度上,分析旅游者的網絡關注度現狀,并為當地旅游發展提供經驗啟示。
隨著大數據與旅游電子商務的應用,互聯網的輿情信息能夠為旅游目的地提供大量更為科學、直觀的實時數據支持。通過百度指數的規律探尋、關鍵詞抓取后,利用清博系統的競對分析,評估旅游產業發展水平,分析旅游者的普遍感受及個性化需求,從而推動全域旅游示范區的長期高質量發展。