999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混合主題語義特征提取的旅游吸引物地理畫像

2022-12-07 06:59:18甜,張巖,陳成,2,陳
地理與地理信息科學 2022年6期
關鍵詞:語義特征旅游

溫 夢 甜,張 巖,陳 能 成,2,陳 澤 強

(1.武漢大學測繪遙感信息工程國家重點實驗室,湖北 武漢 430079;2.中國地質大學(武漢)國家地理信息系統工程技術研究中心,湖北 武漢 430078)

0 引言

旅游吸引物通常指促使人們前往某地旅游的所有因素的總和,包括旅游資源、適宜的接待設施、優良的服務以及快速舒適的旅游交通條件等[1]。我國進入大眾旅游時代,旅游已成為人們生活的重要組成部分,各地政府更加重視旅游業發展,越來越多的城市被打造為旅游城市。通過刻畫城市旅游吸引物地理畫像,可反映城市旅游吸引物的吸引力水平,從而為提高旅游吸引物建設水平、吸引游客提供參考。

目前,關于旅游畫像構建的研究多聚焦于游客畫像和旅游目的地畫像,較少關注旅游吸引物相關畫像的構建。其中旅游目的地相關研究多從游客角度出發,以游客發布的旅游經歷、感知和評價等為基礎數據,運用人工處理分析[2]、自然語言處理和數據挖掘[3-6]等方法構建游客對旅游吸引物的認知形象、情感形象等。旅游吸引物的地理位置、集群和周邊配套設施建設情況能反映當前旅游吸引物的吸引力水平,直接影響游客的旅游意愿和對景點的認知形象,是客觀刻畫城市旅游吸引物形象的重要因子,然而,現有關于城市旅游吸引物畫像的研究較少考慮旅游吸引物的地理位置和配套設施等因素,不能對旅游吸引物的建設提供有力參考。興趣點(POI)包含城市中各種類別的設施點,其空間分布和頻率權重可反映當前區域的功能特征[7];此外,POI數據樣本量大、涵蓋信息詳細、位置精確度高、易于獲取,被廣泛應用于地理分析的各方面[8]?,F有城市畫像研究通過POI、手機定位等方面地理空間位置數據實現對城市功能區、土地利用等的形象刻畫[9,10],同樣,旅游吸引物周邊區域的POI可體現該旅游吸引物的功能特征,反映其功能設施的建設是否完備。因此,本文利用POI數據研究旅游吸引物的功能特征,據此從地理空間和地理語義兩個角度提出一種城市旅游吸引物地理畫像的構建方法,以期為游客對旅游目的地的選擇提供參考。

1 數據與研究方法

1.1 研究區與數據

武漢市位于我國中部地區,素有“九省通衢”之稱和“江城”的美名,具備豐富的自然和人文旅游資源。根據《武漢年鑒(2021年卷)》[11]顯示,武漢市有名勝古跡339處、革命紀念地103處、各級重點文物保護單位275處。本文選取武漢市旅游吸引物分布相對集中的江岸區、江漢區、硚口區、漢陽區、武昌區、青山區、洪山區7個主城區作為研究區(圖1)。

本文采用2021年武漢市百度地圖POI數據,經過投影、坐標糾偏和去除重復點后,提取武漢主城區POI數據共337806條,包括風景名勝、生活服務、餐飲服務、交通設施服務、體育休閑服務、科教文化服務、通行設施、公司企業、商務住宅、醫療保健服務、住宿服務、政府機構及社會團體、公共設施、金融保險服務、購物服務、汽車服務、汽車維修、汽車銷售18個基本類別。武漢市主城區旅游吸引物包括城市廣場、動物園、風景名勝、公園、公園廣場、國家級景點、省級景點、海灘、回教寺紀念館、教堂、旅游景點、水族館、寺廟道觀、植物園等15個子類別,共1 895條POI,其空間分布如圖1所示。

圖1 武漢市主城區旅游吸引物分布

1.2 研究方法

本文研究技術流程(圖2)為:首先,基于預處理后的POI數據,采用隱式狄利克雷分布(Latent Dirichlet Allocation,LDA)模型提取武漢市主城區1 895 個旅游吸引物周邊設施的主題語義特征,描述旅游吸引物周邊的設施類型分布;其次,通過DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法對旅游吸引物進行空間聚類,分析旅游吸引物集群的空間分布格局和主題;最后,在旅游吸引物集群的尺度上,通過Hill Numbers多樣性指數分析旅游吸引物的主題混合模式,對比評估不同旅游吸引物配套設施的完善程度,并從空間和語義兩個角度構建旅游吸引物地理畫像。

圖2 研究技術流程

1.2.1 隱式狄利克雷分布(LDA)模型 LDA模型是自然語言領域常用的主題模型,可用于挖掘隱含的主題語義[12,13]、提取事件主題[14,15]或進行文本分類[16]等,已被廣泛應用于城市功能區提取[17]、個性化景點推薦[18]和輿情時空演化分析[19]等領域。本文將每個旅游吸引物緩沖區內的各POI基本類別文本視為詞項,將所有詞項合并為文檔,通過LDA模型提取不同旅游吸引物主題。求解LDA模型可得到“主題—詞項”矩陣和“文檔—主題”矩陣:前者反映每個主題的詞項概率分布,每個主題可用其詞項概率分布表示為一個向量,從而進行主題之間的計算和對比;后者反映每個文檔的主題概率分布,相應地,每個文檔也可用其主題概率分布表示為向量,從而進行計算對比。另外,主題數量是LDA模型的一個重要參數,代表該模型描述文本的能力。主題數量越小,模型描述文本的能力就越弱,不足以描述文檔的主題分布;而主題數量過大又會導致主題冗余、模型過擬合、訓練時間增加。本文選取最常用的困惑度[20]和一致性[21]作為衡量主題數量選取的標準,困惑度反映一篇文檔屬于某主題的不確定性,困惑度越小、一致性越高,則模型效果越好。

1.2.2 DBSCAN空間聚類算法 同一空間范圍內的旅游吸引物往往有相似的主題分布,對其進行聚類即可得到旅游吸引物集群。DBSCAN算法是一種基于密度的空間聚類算法,能將具有一定密度的區域劃分為集群,并在具有噪聲的空間數據中發現任意形狀的集群,因此本文采用該算法對旅游吸引物進行空間聚類,進而分析旅游吸引物集群的主題語義特征和空間格局,可在集群尺度對旅游吸引物有更清晰的感知,從而為游客選擇心儀的出行目的地提供建議。

1.2.3 Hill Numbers指數 生態學中廣泛使用的多樣性度量框架模型——Hill Numbers指數能較好地解決熵指數在度量功能多樣性多維特征方面存在的缺陷[9,22-25],因此,本文采用Hill Numbers指數D(式(1))[26-28]度量各旅游吸引物的主題混合情況(即主題多樣性)。

(1)

式中:s為主題數量;pi為主題i的出現頻率;q為多樣性階數,反映多樣性指數對物種相對豐度的敏感性。1)當q=0時,多樣性指數對所有主題均不敏感,此時為豐富度指數,即該旅游吸引物周邊的主題數量,取值范圍為1~18,其值越大,表明該旅游吸引物周邊主題語義特征越豐富;2)當q=1時,多樣性指數取決于主題的出現頻率,其值等于對香農熵指數取冪指數,反映旅游吸引物周邊主題的混合度,較高熵值表示旅游吸引物周邊各類主題語義特征間混合較好,較低熵值表明旅游吸引物周邊功能較單一,主題混合較差;3)當q=2時,多樣性指數為逆辛普森指數,反映主題的集聚度,其既考慮了主題的豐富度,也考慮了不同主題的均勻度,指數越大,表示旅游吸引物周邊各類主題語義特征之間數量分布差異越小(相對均勻)。

2 實驗結果分析

2.1 旅游吸引物主題語義特征提取

旅游吸引物周邊POI設施的分布可反映該旅游吸引物的主題語義特征。本研究以武漢市POI數據為基礎構建訓練語料,確定主題數量,通過LDA模型提取武漢市旅游吸引物的主題語義特征。

2.1.1 訓練語料構建與主題數量確定 LDA模型是一種典型的詞袋模型[12],在構建語料時不需考慮詞項間的順序。本研究以每個旅游吸引物為中心做緩沖區,將緩沖區內的POI基本類別字段作為詞項分別組織成文檔,從而構建LDA模型的訓練語料。如圖3所示,當兩個旅游吸引物距離較近而緩沖區有重疊時,則對緩沖區內的POI進行多次采樣。當緩沖區較大時,重疊部分隨之增大,大量POI被多次采樣,會導致語義重復、數據冗余。經過實驗對比,本文以50 m作為旅游吸引物的緩沖距離。為選取合適的主題數量,本文計算并繪制了主題數量從2到35的“困惑度—主題數量”和“一致性—主題數量”曲線(圖4),可見困惑度隨主題數量的增加呈波動下降趨勢,且在主題數量超過17后漸趨平穩;在主題數量為17~22中,18對應的一致性較高,為避免主題數量較多而產生過擬合,本文主題數量選取18。

圖3 POI采樣構建語料示意

圖4 困惑度和一致性與主題數量的關系

2.1.2 主題語義特征提取結果 采用LDA模型可得到每個旅游吸引物周邊的主題分布及每個主題中的POI基本類別分布。不同的主題揭示了不同的POI共現模式,即每個主題內的各類POI出現的概率不同,本文按概率從大到小排序概括主題語義特征,展示了18個主題及其前5類POI的組合(表1)。為更明確地表示各主題的POI類別構成,將每個主題下概率較大的前5類POI詞項繪制成詞云,詞項字號越大,表示其在該主題中出現的概率越高(圖5)。由表1和圖5可知,不同主題下POI的組成和出現概率不同,通過每個主題中出現概率較大的特征詞項結合POI的共現模式,可初步判斷該主題的語義。部分主題語義特征十分鮮明,單個類別的POI出現概率達95%以上,如主題7、主題12和主題13分別表示風景名勝主題、商務住宅主題和生活服務主題;主題16中科教文化服務類設施達到92%,同風景名勝、政府機構及社會團體和生活服務等類型的POI共同體現了高校主題;主題15以室內設施類POI為主,兼顧餐飲服務、購物服務、公共設施、體育休閑服務等,共同體現了商場主題;主題11中的醫療保健服務、交通設施服務等共同體現了醫療機構主題。為衡量主題語義特征提取是否合理,計算各主題向量間的余弦相似度,得到主題相似度矩陣(圖6)。由圖6可知:主題7和主題17之間余弦相似度高達92%,均以風景名勝設施為主,與生活服務等POI共同出現,體現了風景名勝主題;主題2和主題6之間的余弦相似度高達88%,均為購物服務、餐飲服務、生活服務等類型的POI,凸顯了購物服務主題;其他各主題之間的余弦相似度普遍較低,說明主題之間相對獨立,重合內容較少,主題提取結果較好。

圖6 主題間的余弦相似度

表1 LDA模型提取主題的前5類POI及出現概率

圖5 主題詞項詞云

2.2 旅游吸引物空間格局分析

對武漢市旅游吸引物進行DBSCAN聚類并去除離散點,得到旅游吸引物集群空間分布(圖7)。由圖7可知:1)通過DBSCAN聚類得到的旅游吸引物集群與武漢市景區實際分布基本吻合,如黃鶴樓景區(集群3)、東湖聽濤景區(集群7)、東湖磨山景區(集群2)、武漢植物園(集群17)、東湖落雁景區(集群30)、武漢大學(集群18和集群20)、光谷步行街(集群15)、漢口江灘(集群5)、歸元禪寺(集群12)、武漢園博園(集群14)、武漢歡樂谷(集群32)等。2)武漢市主城區的旅游吸引物集群呈多中心分布空間格局:漢口區域的旅游吸引物主要沿漢口江灘線狀分布,中山公園、解放公園和武漢園博園等集群自成中心;漢陽區域的旅游吸引物主要分布在漢江、長江交匯區域;武昌區域的黃鶴樓、東湖沿岸、光谷步行街和各個高校分別形成旅游吸引物集群。

圖7 旅游吸引物DBSCAN聚類結果

為進一步分析武漢市旅游吸引物集群的主題語義特征,本文將每個集群內旅游吸引物的“文檔—主題”向量均值作為該集群的向量,并繪制相應的矩陣圖(圖8)。由圖8可知,有一半的集群中風景名勝主題出現的概率最大,說明這些集群內大部分旅游吸引物周邊以風景名勝類設施為主,集群2、7、14、17最具代表性,分別對應東湖磨山景區、東湖聽濤景區、武漢園博園、武漢植物園這類戶外自然景區,它們與城市中心功能區分離,而集群內部風景名勝類的旅游吸引物之間距離較近,其他類型設施較少,因此出現概率最大的POI仍為風景名勝。集群32(武漢歡樂谷)中體育休閑主題出現的概率達32%,且餐飲服務主題概率也較高,體現了武漢歡樂谷附近的休閑娛樂屬性。集群18(武漢大學)、集群28(中國地質大學)、集群31(華中科技大學)等高校是極具特色的人文類旅游吸引物,以科教文化服務主題為主,與風景名勝、商務住宅、體育休閑服務等主題共同出現。5、6、15、23等集群中,餐飲服務主題出現的概率在10%以上,購物服務主題出現的概率達20%以上,它們分別對應漢口江灘、洪山廣場、光谷步行街、楚河漢街集群,附近均有美食集聚地和購物商鋪,說明了其商圈特征。部分集群的主題分布較均勻,如集群5(漢口江灘)、集群8(解放公園)和集群10(中山公園),說明這些集群的主題語義特征不突出,設施分布較均勻。由以上分析可知,武漢市的旅游吸引物大致分為自然景區、娛樂景區、人文景區、商圈美食和公園等類別,不同類別的旅游吸引物集群的空間分布錯落有致。結合主題語義特征對旅游吸引物進行空間布局分析,可更清晰地感知武漢市的旅游吸引物布局,且能通過不同的主題共現模式感知旅游吸引物配套設施的建設情況。

圖8 旅游吸引物集群向量

2.3 旅游吸引物主題混合模式挖掘

進一步結合語義特征和空間特征分析旅游吸引物的主題混合模式,每個旅游吸引物均可通過“文檔—主題”矩陣表示為一個向量,不同的主題組合不僅能揭示該旅游吸引物的功能分布,還能揭示其功能豐富程度。由圖8可知,各集群中各個主題的概率均不為0,因此主題豐富度(即Hill Numbers零階多樣性)均為18。本文用Hill Numbers指數計算每個旅游吸引物的一階多樣性和二階多樣性指數,然后將每個集群均值作為集群的多樣性指數。

將具有代表性的旅游吸引物集群的多樣性指數從高到低排名(表2),可為游客選擇旅游目的地提供建議:對于旅游出行目的多樣的游客而言,可選擇主題語義特征多樣性較高的旅游吸引物作為旅游目的地,如漢口江灘、中山公園和解放公園等區域景點密集,配套設施豐富,可滿足游客的一站式出行需求;對于旅游出行目的較單一的游客而言,可直接選擇主題語義特征突出的旅游吸引物集群作為旅游目的地,如希望在節假日到戶外散心、感受大自然的游客可選擇以風景名勝主題語義特征為主的武漢園博園、武漢植物園以及東湖各個景區,希望購物的游客可打卡楚河漢街、光谷步行街等商圈。同類景點中,游客還可參考主題語義特征多樣性及旅游吸引物的空間位置選擇出行目的地。

表2 旅游吸引物集群主題語義特征多樣性排名

各景區中,主題混合度和優勢度兩指數均高的區域包括漢口江灘、中山公園、解放公園等,以商圈和公園為主,主要是購物服務、餐飲、公司企業、通行設施等主題的混合模式,其主題混合度較高且主題優勢度較好,說明這些區域POI設施豐富且分布較均勻;兩指數均低的區域主要有武漢園博園、武漢植物園、東湖聽濤景區、東湖磨山景區、東湖落雁景區等,這些區域主題構成以風景名勝為主,景區定位較單一,所以主題混合度和優勢度均較低。另外,黃鶴樓、武漢大學等集群的主題混合模式主要包括風景名勝、公司企業、餐飲、體育休閑等主題,混合度相對較高,但主題優勢度較低,說明現有的主題混合不夠均勻。

經過對主題特征混合度和優勢度分析,發現每個主題在不同混合模式下作用不同。主題混合度和優勢度均高的主題混合模式中最常出現的主題包括購物服務、餐飲、通行設施等,說明這些主題對其他主題的吸引力很大,從而可提高主題多樣性;而兩指數均低的混合模式中以風景名勝主題為主,這是因為景區的定位比較明確,主題相對單一,且有一定的禁建、限建要求,因此其主題多樣性較低。根據旅游吸引物集群的不同主題語義特征和主題混合模式,可為游客提供更精細化的出行建議,也可為景區建設提供相應參考。在自然景區建設中,可在滿足景區禁建、限建的要求下,適當引入餐飲、購物行業,增設交通服務設施,如在東湖沿岸景區中,增設共享單車借還點、自動售賣機和垃圾桶,從而使景區服務更多元和便捷;在建設商圈等旅游吸引物時,可設置更明確的主題定位,從而避免商圈的同質化競爭。

3 結論與討論

POI的空間分布與人們的活動高度相關,不同的POI共現模式體現了不同的功能主題,顯示了不同旅游吸引物的特點。本文基于武漢市POI數據,通過LDA模型提取旅游吸引物周邊區域的主題語義特征,對旅游吸引物進行空間聚類,分析其空間格局,并進一步計算每個集群的主題多樣性,從空間特征和語義特征兩個維度為刻畫城市旅游吸引物地理畫像提供新思路。具體結論如下:1)提取了武漢市旅游吸引物的18個主題語義特征,不同的主題表現為不同的POI共現模式。其中部分主題特征鮮明,如7、12、13等主題分別表示風景名勝、商務住宅和生活服務主題;部分主題(如主題2和主題4)為混合主題,其各類POI的出現概率差別較小。2)武漢市多數旅游吸引物呈現明顯的空間集聚,不考慮離散的旅游吸引物,共形成具有不同主題特征的32個景點集群。武漢園博園、武漢植物園、東湖各風景區等自然景觀景區位置較偏僻,其主題特征主要為風景名勝,其他主題特征不明顯;武漢大學、華中師范大學等高校主要分布在洪山區,其語義特征以科教文化服務主題為主,兼具生活服務和政府機構及商務住宅主題;光谷步行街、楚河漢街等商圈交通便利,設施齊全,主題特征豐富多元。3)各個主題在不同混合模式下作用不同。購物服務、餐飲、通行設施等主題更易吸引其他主題,提高主題多樣性;而風景名勝主題較為單一,其主題多樣性較低。在自然景區的建設中,可在滿足景區禁建、限建的政策要求下,引入適量的公共服務、餐飲服務等其他類型設施,以提升游客的游覽體驗;在城市廣場、商務區等旅游吸引物集群中,可因地制宜建設有特色的主題商圈。游客可結合旅游吸引物的主題特征、空間分布和主題多樣性選擇旅游目的地。

本研究以POI為基礎數據,數據源較為單一,研究結果依賴POI的數據質量,后續研究可結合用地類型、社交媒體數據[29]等多源數據提取主題特征。

猜你喜歡
語義特征旅游
語言與語義
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
旅游
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
旅游的最后一天
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
主站蜘蛛池模板: 国产免费高清无需播放器| 又黄又湿又爽的视频| a在线观看免费| 成人va亚洲va欧美天堂| 精品无码一区二区三区电影| 好吊妞欧美视频免费| 国产91特黄特色A级毛片| 99精品国产自在现线观看| 青青青视频免费一区二区| 色综合天天综合| 成人午夜亚洲影视在线观看| 91精选国产大片| 亚洲国产日韩欧美在线| 福利视频一区| 欧美日韩高清| 国产成年女人特黄特色毛片免| 国产欧美日韩一区二区视频在线| 2021国产v亚洲v天堂无码| 国产无码精品在线| 青青国产视频| 色哟哟国产精品| 亚洲aaa视频| 免费一级毛片在线播放傲雪网| 国产精品无码一二三视频| 午夜国产在线观看| 国产成人精品免费视频大全五级| 欧美精品啪啪一区二区三区| 国产成人亚洲综合A∨在线播放| 最新国产精品鲁鲁免费视频| 2021国产乱人伦在线播放| 久久久精品无码一二三区| 国产精品久久久久久久伊一| 91av成人日本不卡三区| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲天堂首页| 日韩国产黄色网站| 五月天福利视频| 狠狠干综合| 色悠久久综合| 欧美在线免费| 国产成人精品2021欧美日韩| 999精品色在线观看| 日韩性网站| 国模视频一区二区| 一级毛片基地| 国产毛片不卡| 中文字幕无码av专区久久 | 免费国产小视频在线观看| 露脸国产精品自产在线播| 亚洲天堂成人在线观看| 国产激情影院| 国产永久在线观看| 亚洲日韩精品伊甸| 狠狠色丁香婷婷综合| 囯产av无码片毛片一级| 成人精品区| 国产91色| 国产精品99久久久| 日韩精品久久久久久久电影蜜臀| 一级毛片a女人刺激视频免费| 中文字幕色站| 精品小视频在线观看| 日韩国产一区二区三区无码| 毛片一级在线| a毛片基地免费大全| 欧类av怡春院| 久久久久久高潮白浆| 亚洲综合色吧| 成年网址网站在线观看| 久久久久久高潮白浆| 国产精品理论片| 人妻少妇乱子伦精品无码专区毛片| 欧美在线伊人| 91精品啪在线观看国产| 久久久精品国产亚洲AV日韩| 五月激情婷婷综合| 久久久久青草线综合超碰| 91福利免费视频| 无码aⅴ精品一区二区三区| 久久人妻xunleige无码| 高清欧美性猛交XXXX黑人猛交| 午夜福利在线观看成人|