李 華,孔 嬌
(西安建筑科技大學 資源工程學院,陜西 西安 710055)
隨著人們對美好生活需要的增長,節假日旅游成為社會熱點活動,景區密集人群的安全管理已然成為公共安全領域的熱點、難點問題之一。2019年新型冠狀病毒肺炎疫情爆發,使得旅游業遭受重創。隨著國內疫情防控措施的有效實施,旅游業開始復蘇。2021年“五一”小長假期間,西安旅游客流量迎來爆發式增長,各大景區累計游客接待量連創新高,其中大唐不夜城景區接待游客177萬人次,同比增長143%[1]。
網絡評論數據是影響旅游者做出出行決策的重要因素之一。網絡評論客觀地反映旅游者對景區旅游安全管理的真實感知,影響潛在旅游者的出行決策和景區的安全管理狀況。隨著數據挖掘技術的不斷深入研究,文本挖掘技術能夠充分挖掘文字中潛在且有價值的信息,該技術已成為分析網絡評論數據在內的文本評論數據的重要方法。
2005年,Aguirre[2]運用社會心理學理論分析突發事件中的恐慌情緒,發現群體恐慌的產生與群體內部成員、群體的密度、群體與群體的關系等因素相關。Uur等[3]從TripAdvisor論壇檢索了約7.5萬條評論并采用文本挖掘技術展示新型冠狀肺炎疫情大流行期間游客的反應。2010年,孟博等[4]率先建立風險感知理論模型,通過分析提出風險感知是公眾在面對風險時形成風險判斷和行為態度的基礎。趙岑等[5]構建暴雨災害風險感知評價三級指標體系進行游客暴雨災害風險感知評價研究。李華等[6]指出景區密集人群的風險路徑為自由移動階段→人群滯留階段→局部聚集行為→人群擁擠階段→對抗行為。隨著大數據時代的到來,突發事件背后的公眾風險感知大數據成為獲取公眾心理、情緒和訴求的重要渠道[7]。徐選華等[7-8]通過TF-IDF算法提取并量化公眾風險感知,建立大群體應急決策質量打分函數,探討公眾風險感知對應急決策質量的影響。陶鵬[9]構建1種文本大數據與扎根理論相結合的方法,分析研究政府風險管理的使用偏好。
國內外關于風險意識研究多以宏觀角度分析風險狀況,以事故發生為出發點考慮人員行為為主。鑒于此,本文以文本大數據為基礎,從微觀角度在分析公眾風險意識的基礎上,進行城市景區密集人群風險感知研究。運用文本分析方法,提取影響密集人群風險感知的主題及關鍵詞,對風險感知規律進行分析;基于計劃行為理論,構建城市景區密集人群風險感知影響因素模型,明確密集人群風險感知風險影響因素的作用規律,從而找出游客對景區密集人群風險感知的關鍵特征。
1)潛在狄利克雷分配(LDA)
潛在狄利克雷分配(Latent Dirichlet Allocation,LDA)主題模型是1種文檔主題生成的3層貝葉斯概率模型,包含詞語(word)、主題(topic)和文檔(document)3層結構。其按照概率分布的形式給出文檔集中每篇文檔的主題,屬于1種非監督機器學習技術,能夠識別文檔集或者語料庫中潛藏的主題信息[10]。1篇文檔中每個詞語出現的條件概率計算如式(1)所示:
(1)
2)詞向量模型(Word2Vec)
通過LDA主題模型提出文本主題及關鍵詞,進而采用主題詞向量法獲取主題與關鍵詞之間的關聯關系。Word2Vec詞向量模型是1種無監督的神經網絡結構,包括CBOW和Skip-gram 2種神經結構。Word2Vec模型訓練結果將關鍵詞映射成詞向量,而詞向量的余弦值可以用來表示關鍵詞的語義相似度,余弦值越大,關鍵詞在語義上越相近,關鍵詞的關聯關系越大,即相關度越大[11]。關鍵詞wi,wj間的相關度計算如式(2)所示:
(2)
式中:Wi,Wj為詞向量;xik是Wi在k維上的向量值;xjk是Wj在k維上的向量值;cos(Wi,Wj)是詞向量Wi,Wj的余弦值,即為關鍵詞wi,wj的相關度。
主題zi,zj間的相關度計算如式(3)所示:
(3)
式中:Zi,Zj為主題詞向量;yik是詞向量Zi在k維上的向量值;yjk是Zj在k維上的向量值;cos(Zi,Zj)是主題Zi,Zj的余弦值,即為主題詞zi,zj的相關度。
3)語義網絡
本文建立的LDA和Word2Vec模型通過推斷的主題詞概率或特定的術語頻率規則來選擇主題及關鍵詞,確定主題及關鍵詞之間的關聯關系。然而,由于上述計算主要基于關鍵短語的頻率,不能捕捉關鍵短語的潛在含義。因此基于網絡的主題關鍵短語抽取結果采用語義網絡來確定關鍵短語的語義關系,得到主題共現矩陣Q如式(4)所示:
(4)
式中:Q為主題共現矩陣;qij為第i個和第j個主題間相關度。
大唐不夜城位于陜西省西安市大雁塔南側,北起大雁塔南廣場,南至唐城墻遺址,步行街全長2 100 m,寬500 m。本文以西安城市景區“大唐不夜城”為例,選取2019年12月31日至2021年5月30日時間段內攜程、大眾點評、美團3個專業網站上發表的關于此景區的評論作為數據源,篩選后得到1 154條有關密集人群的評論作為有效網絡文本。
采用文本挖掘的研究方法,首先通過Python3.7對城市景區密集人群網絡評論大數據進行預處理,包括清洗、分詞,其次采用無監督機器學習對網絡文本語料進行主題提取,通過社會網絡分析進行語義網絡輸出并對其中心性進行分析,根據提取結果分析景區密集人群風險感知規律。文本挖掘流程如圖1所示。
圖1 文本挖掘流程Fig.1 Process of text mining
本文數據來源于大唐不夜城景區游記與評論語料,通過對評論進行逐條閱讀,篩選關于城市景區密集人群的游記和評論作為數據源,語料規模為130 371字。首先對文本數據進行預處理,由于在線網絡評論語言風格較為隨意,需要從搜集的語料庫中篩除無效評論,如“啊啊啊啊”“!!!”等無價值評論。中文文本之間無空格,采用Jieba分詞包對文本進行分詞處理,將連續的語句轉換為詞語,作為文本的組成要素。
分詞后需要剔除無效關鍵詞,如“嗎”、“是”、“了”、“·”、“哈”、“轉發”等,以提高文本挖掘的精度。采用哈工大停用詞庫并加入具有本文語料庫特點的停用詞,構建匹配本文的停用詞庫進行去除停用詞,獲得15 912個關鍵詞。
詞云代表語料集中關鍵詞的詞頻,通過文本分析自動創建所展示的關鍵詞。在文本中出現頻率較高且突出度較高的詞語在可視化中會顯示為較大的字體,可用于突出重要術語或引起注意。其作用不僅限于在視覺上為演示增色,并且可以更加直觀地介紹主題,展示語料集中高頻詞的全貌。因此,詞云是游客風險感知和評論趨勢的初步示意。采用WordStat軟件生成主題及關鍵詞詞云如表1所示。
表1 主題關鍵詞提取結果及詞云展示Table 1 Results of topic keywords extraction and word cloud display
將預處理得到的文本文件利用LDA主題模型的類屬主題提取功能,構建評論主題的LDA主題模型。設置主題數目K為9,主題有“常規表演”、“外部交通”、“游覽時段”、“游覽線路”、“網紅表演”、“商圈”、“游覽密度”、“景區”、“文化”,設置展示每個主題出現頻率最高的10個關鍵詞。同時將每組主題中的關鍵詞進行詞云圖分析,如表1所示。
這9個主題及其關鍵詞所組成的語義網絡體現了個體在城市景區密集人群情境下對于風險的態度流露或表現,即個體的風險感知偏好。風險感知偏好通過對個體信息取舍作用形成認知偏差,影響風險感知,進而影響個體行為的產生[12]。因此,風險感知偏好作為風險感知的前因變量[13],影響著個體的風險感知嚴重性與風險感知可能性,即風險感知程度,而主觀規范、行為態度及知覺行為控制作為結果變量,體現了風險感知對于行為結果的負向作用。
風險感知是指個體在當下所處的環境下,對風險的主觀評定和判斷以及由此引發的行為決策與心理反應。通過文本分析方法提取主題與關鍵詞及二者間關聯關系,為進一步明晰城市景區密集人群風險感知對個體行為決策與心理反應的作用機理以及影響路徑,本文借鑒計劃行為理論(Theory of Planned Behavior,TPB),將風險感知變量引入計劃行為理論,構建密集人群風險感知影響因素的TPB模型,揭示個體對于城市景區密集人群風險感知及行為特征的作用規律,如圖2所示。
圖2 基于TPB的密集人群風險感知影響因素模型Fig.2 Model of influencing factors of dense crowd risk perception based on TPB
計劃行為理論中的實際行為是個體在城市景區密集人群情景下采取的具體應對行為。行為意向是個體在城市景區密集人群情景下采取某種行為的主觀判斷。行為態度是個體對密集人群景區風險的嚴重性與可能性感知。主觀規范是個體參照密集人群防控措施及景區管理規范帶來的行為規范。感知行為控制即個體的風險應對經驗以及預期的阻礙,個體經驗越豐富、預期阻礙越小,則感知行為控制越強烈。行為態度體現了個體對于風險的感知程度,其作為中介變量對于行為意向的影響相較于其他2個因子相對較弱。個體風險感知嚴重性與風險感知可能性對個體行為態度有直接的負面影響,從而間接影響行為意向。
個體在城市景區密集人群情境下產生的實際行為是行為意向的外在表現。行為意向決定實際行為,而行為意向由主觀規范、行為態度和感知行為控制3個要素所決定。文獻[14]研究表明,個體風險認知水平越高,內心越容易產生恐慌感從而對個體的應對行為產生一定的消極影響。如果能夠控制不安全行為的發生,減少其數量,必然會降低事故發生的可能性[15]。綜上,使得個體在密集人群情景下的風險感知強度處于穩定較低水平,避免公眾產生消極行為,將降低踩踏事故發生的可能性。
本文從個體風險感知水平的影響要素入手,通過分析語料集中密集人群風險感知主題的共現規律,明確密集人群風險感知偏好的作用規律。共現分析是統計詞語在同一文本中出現的次數,通過詞語間的共現關系反映語料集的主體內容,從而挖掘出語料集中的隱含信息。
1)主題共現規律
通過式(3)計算主題的相關度,進而根據式(4)得到風險感知主題共現矩陣,如表2所示。
表2 風險感知主題共現矩陣Table 2 Co-occurrence matrix of risk perception topics
利用Ucinet軟件將主題詞分析結果進行可視化分析,構建語義網絡。將上述共現矩陣導入Ucinet軟件,選擇NTEDRAW可視化功能,得到風險感知主題語義網絡結構圖,如圖3所示。由圖3可以看出,越靠近中心的主題詞,重要度越高;主題詞關聯線越粗,則關鍵詞關聯關系越明顯。
根據風險感知主題共現矩陣,其中心度是表示關鍵詞在語義網絡中重要程度的重要測量指標,關鍵詞越靠近中心則表示該關鍵詞越重要[15]。根據Ucinet軟件計算結果輸出主題中心度如表3所示。
由圖3和表3可知,主題重要度排序由高到底依次為“網紅表演”、“景區”、“外部交通”、“游覽線路”、“游覽密度”、“游覽時段”、“常規表演”、“商圈”、“文化”,其中重要度最高的是“網紅表演”主題,即核心影響因素,即游客前往游覽的核心吸引力。“常規表演”、“商圈”、“文化”主題的特征向量中心度處于較高水平,這表明其在網絡中的連接節點較為重要。
圖3 風險感知主題語義網絡結構Fig.3 Semantic network structure of risk perception topics
表3 主題中心度Table 3 Centrality of topics
2)關鍵詞共現規律
選取每個主題強度最高的3個關鍵詞進行共現分析構建語義網絡,得到城市景區密集人群風險感知關鍵詞語義網絡結構,如圖4所示。計算輸出關鍵詞中心度如表4所示。
表4 關鍵詞中心度Table 4 Centrality of keywords
圖4 風險感知關鍵詞語義網絡結構Fig.4 Semantic network structure of risk perception keywords
1)網紅表演主題。該主題的中介中心度為19.964,其重要度在主題重要度中最高,說明此主題是該景區密集人群情境下個體風險感知來源的核心要素。同時該主題特征向量中心度為28.146,該主題在網絡中對于其他主題的影響較小,這得益于景區管理部門制定的行為規范對個體主觀規范的約束,進而對個體實際行為產生正向影響。其中,“演出”中心度最大,因此可通過提高熱門表演管制力度,加強個體主觀規范對個體實際行為的正向影響,避免游客因受熱門表演的吸引而導致出現人群滯留、局部聚集等危險狀態。
2)景區主題。該主題中介中心度為18.199,僅次于網紅表演主題,是個體風險感知來源的關鍵要素之一。其中,“小吃”的中心度最高,該景區由于其豐富多樣的小吃及較高的性價比,是該景區對游客的重要吸引力。
因此可以通過加強對餐飲安全的管理力度,增強其感知行為控制。同時,“高峰”及“引導”關鍵詞體現了游客對于人員密集區域的引導指示標志、廣播語言播報具有較強的心理需求。因此,指示標志及廣播語音播報的有效引導將提高個體感知行為控制,降低游客對于人員密集景區夜游風險的感知強度。
3)外部交通主題。該主題中介中心度為16.361,特征向量中心度為32.611,可見交通風險是游客風險感知的重要來源之一,且該主題在網絡中對于其他節點影響較大。其中,“公交”和“疫情”的中心度最高,可知游客通常采取公共交通方式到達景區,經調研發現,景點附近的公交地鐵普遍于23∶00~24∶00停運。可通過增加附近路段晚間配車、增設停車位數量等措施,提高行為態度對個體實際行為的正向影響。另外,提取的旅游評論仍處于疫情期間,個體對疫情的擔憂及密集區域的恐懼是其感知行為控制的主要來源之一,因此,景區應提高疫情防控措施實施力度,加強個體感知行為控制對其行為的正向影響,降低不安全行為發生的可能性。
4)游覽線路主題。該主題的中介中心度為16.361,特征向量中心度為32.611,可見游覽線路主題對于其他主題節點具有較強的影響。“步行”的中心度最高,游客通常選擇自北向南步行游覽。景區可根據游客行進軌跡,在游客易滯留區域提高安保人員密度,正確引導“人流”,提高個體主觀規范對實際行為的正向影響。
5)游覽密度主題。該主題的中介中心度為16.361,表明該主題是影響游客風險感知水平的重要要素之一。其中,“游客”和“戴口罩”的中心度最高,是游覽密度主題的關鍵要素。節假日該景區的人群密集度水平對游客游覽意向產生影響。加之,游客普遍對于疫情風險具有較強風險認知。這就要求景區管理部門對疫情防控措施有效落實以及對高密度區域有效疏導,從而正確引導游客行為態度,提高個體行為態度對實際行為的正向影響。
6)游覽時段主題。該主題中介中心度為15.037,特征向量中心度為34.437。“燈光”的中心度最高,并且與其他關鍵詞聯系度較高。由馬斯洛需求層次理論可知,人類對于光照的需求是維持自身生存的最基本需求,且在強光下游客極易產生眩光等應激反應。作為夜游特色景區,注意完善景區內道路光照強度及臨近景區道路的照明問題,可降低風險感知強度對個體行為態度的影響,從而對實際行為產生正向影響,避免不安全行為的產生。
7)常規表演主題、商圈主題、文化主題。其主題特征向量中心度均為36.138,處于較高水平,其豐厚的歷史文化及特色建筑使其作為游客體驗盛唐文化的首選地。在網紅經濟帶動下以大唐不夜城為中心形成了一體化商圈,“劇院”、“音樂廳”、“電影院”等基礎設施同時將本地游客錨固在大唐不夜城景區周邊。故以大唐不夜城為中心的商圈不僅是外地游客節假日的旅游打卡地,同時承載了大量本地游客。根據樂觀偏差原則,在面對風險時,景區熟悉程度更高的本地游客通常感知到較低的風險暴露水平。而風險暴露水平的降低會激發樂觀偏差,進而引發不安全行為[16]。因此,景區應加強外部約束,提高個體行為規范對實際行為的正向影響。在考慮其承載能力的前提下通過增強夜間限力度、周邊交通疏導力度、節假日限流力度等措施,約束各街區熱門表演局部密集人群的人流密度,是減少個體不安全行為的重要措施。
1)以文本大數據為基礎采用計劃行為理論對城市景區密集人群風險感知進行系統研究,構建出城市景區密集人群風險感知影響因素模型。研究表明,降低個體在密集人群情景下的風險感知水平,避免公眾產生消極行為,將降低踩踏事故發生的可能性。
2)對主題進行共現規律分析進而明確密集人群風險感知主題對個體風險感知的作用規律,發現核心風險感知偏好主題為網紅表演主題。因此景區管理部門應重點針對其熱門表演做好風險預判,通過提升景點周邊配套設施及夜間交通管控力度等措施,降低個體風險感知強度,減少個體不安全行為的產生。
3)本文建立的風險感知影響因素模型,綜合考慮出行游客、景區管理部門、密集人群風險管控部門三者的風險問題,可以完善城市景區密集人群風險管理和風險溝通機制,使參與人員密集景區服務的有關主體之間能夠就風險問題展開溝通和交流,從而有效地管理風險。