吳 濤,汪 璐,秦 建 新*,向 隆 剛,曾 芷 萱
(1.湖南師范大學地理科學學院/地理空間大數據挖掘與應用湖南省重點實驗室,湖南 長沙 410081;2.武漢大學測繪遙感信息工程國家重點實驗室,湖北 武漢 430079)
“社會感知”作為一種研究人類時空行為特征、揭示社會經濟現象的理論和方法,已廣泛運用于城市功能區識別[1]、用戶時空行為研究[2-5]、城市規劃[6]、旅游活動類型判別[7-10]等方面。近年來,地理空間智能(GeoAI)作為地理空間科學和人工智能深度融合的交叉學科,有力提升了對地理現象過程的動態感知、智能推理和知識發現的能力。大數據時代基于社會感知的地理空間智能研究和應用主要有個性化路徑[11,12]、災害預測[13]、測繪[14-16]、智慧交通[17-19]、智慧醫療[20,21]、智慧養老[22,23]、智慧政務[24,25]等。在智能出行方面,Hung等[26]采用加權方法最小化出行規劃的距離成本;Sun[27]提出以最小鏈路出行時間和出行距離為優化目標的多目標動態路線選擇模型,保證乘客在最短出行時間和距離上選擇可靠出行路線;Zhou等[28]提出一種基于樸素貝葉斯興趣數據挖掘機器學習的智能旅游路線規劃算法。上述研究在出行規劃中鮮有考慮個體意愿,導致推薦的出行路線個性化不足;部分研究雖然分析了個性化的出行方案,但并未與時空環境信息進行充分的動態連接,如李迎[29]在地理興趣區域推薦模型中僅考慮地理因素,未引入時間因素進行更全面的用戶偏好信息挖掘。
綜上,為彌補出行方案個性化的不足,本文基于出行方案推薦與時空環境信息動態連接的現狀,提出基于眾源時空信息的個性化路線服務框架,利用眾源時空大數據感知公眾的出行偏好,將大眾對不同地點的偏好、時間與成本預算等信息映射到實際路網空間中,融合個人意向進行動態建模分析,以期為用戶提供合適且個性化的出行方案。
本文根據社會感知的研究框架[30],提出基于眾源時空信息的個性化路線服務框架(圖1a),包括眾源感知、智能推薦、路線規劃、行程共享4個模塊。1)在眾源感知模塊中,對OSM、大數據展示等平臺提供的眾源時空大數據進行預處理,驗證其信息可靠性,然后由智能推薦、路線規劃、行程共享3個模塊進行引導,設計出符合眾源感知的出行路線;2)在智能推薦模塊中,將從百度地圖、OpenStreetMap、Flickr、社交網站(如 Facebook、新浪微博等)獲取的眾源數據[31]融合并根據用戶偏好信息,通過客戶端進行搜索,結合改進的隱馬爾可夫模型(Hidden Markov Model,HMM)與動態路線優化算法,即可針對實時興趣點的人流量、道路擁堵情況、用戶偏好等信息對用戶進行智能推薦,同時還可使用拓撲語義匹配查詢歷史軌跡,減少互聯網的信息超載,推薦與用戶偏好類似的區域,提供更好的定位服務與出行體驗;3)在路線規劃模塊中,客戶端將用戶數據傳入系統,系統將用戶的特定需求與實時路網數據、POI及其熱度數據[32,33]結合,篩選出符合用戶需求的景點類型,而后將結果可視化,以供用戶選擇出行路線。4)在行程共享模塊中,用戶通過移動設備在網絡平臺上發布包含圖片(像)、文本語義的感知信息,在社交媒體共享其行程[34],平臺將組織與存儲用戶行程規劃和實時旅游信息(如景點交通情況、附近推薦等),并將歷史用戶的多樣化出行路線進行可視化制圖,同時,后端服務器將共享的旅游信息等融入智能推薦模塊,方便其他用戶檢索與查詢。圖1b為基于眾源時空信息感知的個性化路線服務場景。

圖1 基于眾源地理數據的個性化路線服務框架及場景Fig.1 Personalized routing service framework and scenario map based on crowdsourcing geographic data
在個性化路線服務框架的路線規劃模塊中,本文利用眾源時空大數據改進的HMM模型[11],根據個人意愿、POI熱度和路線約束進行動態路線規劃。改進的HMM模型表達式為HMM=(O,S,P,G),其輸入參數為觀測狀態集O、觀測序列S、POI數據集P、路網G和POI-PP(投影點),其實現流程(算法1)為:1)使用POI的推薦信息計算每個POI的大眾推薦度,并構建第一層隱藏狀態,檢查與觀測序列相對應的所有觀測狀態,并檢查每個觀測狀態下的所有POIs,得到每個POI在相應狀態下的大眾推薦度,通過分析POI的大眾推薦度即可得到用戶在不同時期對POI的偏好;2)構建第二層隱藏狀態,該層考慮了路段與POI之間的距離,設置一個距離閾值,計算POI在該閾值內相鄰路段的所有投影點,即可得到POI在第二層隱藏狀態路段上的投影,這些POIs的投影可表示為每個隱藏狀態的候選點;3)利用路網G計算兩個POI點之間的大圓距離GD、不同觀測狀態下投影點之間的路線距離RD以及POI到投影點之間的大圓距離PD,并利用POI的熱度值計算觀測概率,即某狀態在不同時間內所有POIs的熱度值及其對路段的投影,將二者相乘得到每個POI投影點的觀測概率EP,并計算每個POI投影點從狀態Si到Si+1的轉移概率TP;4)將上述步驟計算得到的數據與參數導入HMM,利用Viterbi算法即可生成最優路線的POI訪問序列,即根據用戶個人興趣滿足用戶需求的最佳出行路線[35]。
算法1 基于兩層映射的HMM路線規劃方法
Input:States of observation O;A sequence of observation S;POIs Dataset P;Road network G;The recommendation of POIs PP
Output:Optimal personalized route R
1:PopIndex=calPopularityIndexInfo(P,PP);// 計算每個POI的大眾推薦度
2:Spoi=Sequence(O,S,P,PopIndex);// 每個觀測狀態下的所有POI
3:Sproj=Project(Spoi,G);// 得到POI在路段上的投影
4:foreach hidden state in sido
5: RD=getRouteDistance(Sproj,G);// RD代表兩個投影點之間的路線距離
6: GD=getGreatCircleDistance(Spoi,G);//GD代表兩個POI之間的大圓距離
7: PD=getPOIToProjectionDistance(P,Sproj);// PD代表POI到投影點之間的大圓距離
8: EP=getEmissionProbability(Sproj,PD);// EP 代表POI投影點的觀測概率
9:foreach projection of the POIdo
10: TP= getTransitionProbability(Sproj,RD,GD);// TP代表從Si到Si+1的轉移概率
11:endfor
12:endfor
13:R=createIndividualRoutesModel(EP,TP,G);
14:returnR;
基于眾源時空信息的個性化路線服務平臺(圖2)運用眾源時空數據接入機制與智能路線規劃、語義軌跡數據的組織查詢機制、前后端與線下平臺的協作機制等核心技術,為用戶動態規劃智能出行方案,其系統架構包括前端、后端服務器、數據庫、網絡四方面。前端即搭載的微信小程序,接收數據平臺發布的數據并驗證其可靠性,提供個性化旅游路線設計、歷史軌跡搜索、景點介紹、用戶留言板、出行圖片發布等功能,可及時、準確、完整地根據用戶偏好和實際路網信息為用戶提供個性化路線服務;用戶通過微信小程序搜索引擎和軌跡語義查詢,獲取不同主題的景點推薦度、周邊服務等信息。后端服務器由基礎GIS服務構成,包括騰訊在線地圖開放平臺和云端服務器。騰訊在線地圖開放平臺可以提供實時路網數據、興趣點數據,通過調用騰訊地圖服務提供的API接口完成相關算法。后臺的核心數據管理部分是基于騰訊云端服務器(AMD EPYCTMRome 2核、八通道DDR4 4 G內存、5 Mbps帶寬)部署的SSM框架,即通過Spring的IOC特性和AOP特性實現對象間的依賴關系并支撐便捷解耦,通過SpringMVC與Spring的無縫鏈接實現靈活的數據驗證、格式化和數據綁定機制,通過MyBatis實現業務系統對后臺MySQL數據庫的管理和維護。面對業務突增帶來的資源不足問題,騰訊云服務器可隨時在線增加服務器的CPU、內存、硬盤及帶寬等配置[36],或增加服務器數量以解決問題。

圖2 個性化路線服務平臺——TinspirationFig.2 Personalized routing service platform——Tinspiration
長沙市是我國中部崛起和長江中游城市群的重要戰略支點,2019年開始從傳統意義上的智慧城市向新型智慧城市演進,2021年入選“智慧城市+智能網聯汽車”首批國家試點。岳麓區是長沙市獨立的行政建置,常住人口數量位居長沙市各縣市區之首,擁有岳麓山等生態景觀、岳麓書院等89處文物保護單位、中南大學等16所高校,因此,本文重點選取長沙主城區的岳麓區為研究區域,研究基于眾源地理數據的個性化路線服務體系。研究數據包括從OSM平臺獲取的實驗區2019年實際路網數據,并根據不同主題的大眾推薦度從百度地圖開放平臺獲取76個POI作為實驗點,將其分為大學、主題樂園、古跡、劇院等12個主題。
本研究進行兩組實驗,實驗1選取大學、公園、主題樂園、古跡、博物館、劇院6個主題為實驗對象,實驗2選取名山、商場、公園、劇院、大學、車站6個主題為實驗對象。為驗證不同時段POI熱度值對路線規劃的影響,本文獲取不同月份的POI熱度數據分別進行實驗。將POI熱度劃分為0~0.2、0.2~0.4、0.4~0.6、0.6~0.8、0.8~1.0共5個等級,通過改進的HMM模型得到不同月份的最優路線(圖3、圖4)。由圖3、圖4可知,隨著月份改變,路線也發生相應變化,緣于人們在不同月份對POI的關注度不同。例如,實驗1中,5-6月世界之窗的大眾推薦度高于海底世界,而在7-9月大眾更偏向后者,主要是因為7-9月天氣酷熱,不適宜室外主題樂園游玩。隨著POI關注度提升,規劃路線對其選擇率也增大,但由于距離因素,關注度最高的POI并不意味著最佳選擇。本文同時考慮POI間的路線距離等因素計算出最優路線,且在大多數路線中,候選點一般是該主題中大眾推薦度最高的POI。例如,實驗2中,5-12月的最優路線保持一致,說明選取名山、商場、公園、劇院、大學、車站6個主題規劃路線所展示的POI推薦度最高,進而說明在改進的HMM模型中,熱度數據作為一個影響因素與POI的選擇關系密切。

圖3 實驗1 中6個主題不同月份的最優路線Fig.3 Optimal routes of six subjects in each month in experiment 1

圖4 實驗2中6個主題不同月份的最優路線Fig.4 Optimal routes of six subjects in each month in experiment 2
實驗1和實驗2分別基于1月份和9月份數據,對本文改進的HMM模型與傳統HMM模型和最短路徑分析方法進行對比(圖5、圖6)。傳統HMM模型僅依據已有的POI規劃路線,不考慮POI的大眾推薦度,其提供的規劃路線與本文方法在博物館、主題樂園、大學3個主題中選取的POI熱度等級區別很大,選取的皆是熱度等級最低的POI(圖5),獲取的路線并未融合大眾偏好。最短路徑分析方法僅考慮了距離因素,忽略了其他影響個性化路線規劃的因素,其提供的規劃路線僅選取了途經名山、商場、公園、劇院、大學、車站6個主題中路線最短的POI,規劃路線在商場主題中僅考慮距離因素,選取POI熱度較低的萬達廣場(本文方法選取熱度值明顯高于萬達廣場的五一廣場)(圖6)。因此,傳統HMM模型與最短路徑分析方法得到的路線規劃結果可能只是由大眾推薦度較低的POI組成的一條相對不受歡迎的路線,無法滿足出行者的個人意愿,對大眾吸引力較低。本文改進的HMM模型根據狀態序列隨時間變化而建模,將時空特征與靜態數據相結合,不僅考慮了不同時期POI與環境間的相互作用對人們出行的影響,還考慮了不同月份POI的熱度值,得到的路線與POI熱度符合率較高(圖5、圖6),可在短時間內提供滿足用戶需求的最優路線。

圖5 實驗1基于1月份數據3種方法獲得的最優路線Fig.5 Optimal routes obtained by three methods based on the data in January in experiment 1

圖6 實驗2基于9月份數據3種方法獲得的最優路線Fig.6 Optimal routes obtained by three methods based on the data in September in experiment 2
本文提出基于眾源地理數據的個性化路線服務框架:基于全局路網與眾源數據的聯系,將眾源時空信息與出行者的個人意愿映射到實際路網空間,借助改進的HMM模型進行動態建模,最后選取長沙市岳麓區不同月份的POI熱度數據進行實驗。結果表明,基于眾源地理數據的個性化路線服務框架可根據大眾的偏好與意向,在短時間內靈活規劃不同時空背景下的出行路線,能夠響應用戶的多樣化需求,設計出一條貼合用戶特質和偏好的出行路線,極大提升用戶的體驗感受,以此助力智慧城市的建設,打造文旅融合新生態。本研究在以下方面有待進一步探討:1)保護用戶隱私,借鑒其他方法完善基于眾源時空信息的個性化路線服務平臺;2)完善服務器應急機制,以應對突發情況下的數據穩定獲取問題。