999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多空間尺度融合的出行軌跡規律分析

2023-07-31 05:05:52陸妍玲黃婭琦王杰黃露趙毅李景文
科學技術與工程 2023年20期
關鍵詞:區域

陸妍玲,黃婭琦,王杰,黃露,趙毅,李景文*

(1.桂林理工大學測繪地理信息學院,桂林 541004;2.廣西生態時空大數據感知服務重點實驗室,桂林 541004)

隨著大數據時代來臨與新興數字技術的迅速發展,人類的各種活動特征及內在機制為城市規劃建設以及交通政策提供了數據支撐[1]。通過泛在傳感器的使用被完整和系統地記錄下來并形成海量的時空軌跡數據[2]。海量時空軌跡數據隱含了豐富的城市信息[3]。時空軌跡數據作為研究城市人群的活動規律及時空特征的主要數據來源,具有獲取成本低、數據量大、時空覆蓋范圍廣等優點[4-5]。通過對出行軌跡數據進行時空挖掘,能為城市規劃、交通設計、位置信息服務等應用領域提供參考價值和現實意義。

外國學者在21世紀初對軌跡數據開展研究,最早是面向浮動車的數據[6-7],隨著數據采集能力的提升以及定位設備的廣泛應用,對時空軌跡進行挖掘分析的數據形式更加多樣[8-9]。Brian等[10]通過評估游客出行方式對于公園和保護區環境的影響,以此保護生物多樣性,并提供優質的游客體驗機會。Anu等[11]通過研究在愛沙尼亞收集到的移動定位數據,發現空間流動性隨年齡增長而呈現出線性下降的趨勢,揭示了空間流動性規律。在中國,主要是以出租車數據為數據源提取熱點區域,并對出行需求或交通狀態進行分析和預測[12-14]。秦昆等[15]對武漢市的出租車軌跡數據進行預處理后,利用基于時空數據場的聚類方法提取城市交通熱點區域,并分析出行時空特征。王侃等[16]提出基于時空軌跡的熱點區域提取算法(TSTHE),對1 100條卡車軌跡進行熱點區域提取,該方法改進了傳統的軌跡算法中相似性度量單一和聚類簇數難確定的問題。Zhang等[17]通過聚合具有網絡驅動的海量手機數據,揭示了蕪湖市人群的移動模式,發現蕪湖市的人類活動高度集中在交通分析區(TAZ)層面。焦萍等[18]利用西安的出租車訂單提取軌跡數據,對城市居民出行需求區域進行分析,挖掘其時空分布特征,對城市公共交通規劃等提供一定借鑒。

綜合以上分析,中外學者針對時空軌跡數據的研究在社會建設中已經有了廣泛的應用,但研究多集中在利用各類GPS軌跡數據對某個地區進行一個尺度的研究,研究范圍較單一,缺少多空間尺度融合下的時空軌跡研究。鑒于此,以廣東為研究區域,基于出行軌跡數據聚類算法提取熱點區域,通過軌跡時間分布特征、空間分布特征與熱點等級變化特征等多空間尺度融合進行數據挖掘,在此基礎上進行城市人類活動出行等特征分析。本研究為深入分析城市內部結構特征的研究提供了新的視野。

1 研究區域與研究數據

廣東省位于20°09′N~25°31′N和109°45′E~117°20′E,陸地面積為17.97×104km2,海岸線總長13 870 km,地處中國華南沿海,廣東省下轄21個地級市。根據國家統計局公布的數據顯示,2021年廣東全省總人口約為1.26億人,位居全國第一。廣東省城市內部空間結構復雜多元,道路網絡覆蓋范圍廣,建設用地類型多樣全面,適用于出行軌跡活動熱點研究以及潛在規律的挖掘。研究區域如圖1所示。

圖1 研究區域(廣東省)Fig.1 Study area(Guangdong Province)

研究數據來源于社交媒體騰訊用戶密度(Tencent user density,TUD)數據集。獲取了中國34個行政區TUD數據,日期為2021年4月28日,采樣時間間隔為30 min,將數據劃分為48個時段。并利用Pandas庫篩選出8:00、12:00、18:00的用戶定位數據,數據行數總計約56萬行,數據內容包括經度、緯度和定位次數3個屬性。

同時,研究數據包括來源于高德地圖開發平臺的地圖興趣點(point of interest,POI)數據,時間為2021年3月,共計5 778 750條記錄,包括名稱、經緯度、地址、類別和所屬區域等信息,共17個大類和若干個中類。研究選取餐飲美食、商務住宅、旅游景點、酒店住宿、公司企業、交通設施六大類POI進行處理分析,如圖2所示。

圖2 POI類別熱點圖Fig.2 POI category hot spot map

2 基于出行軌跡數據聚類的熱點區域提取

2.1 DBSCAN聚類算法

DBSCAN算法在密度聚類中得到了較為廣泛的運用,不僅能判別聚類簇之間的差異性,還能夠對出行軌跡數據的集群分布和空間特征進行準確分析[19]。其聚類思想是在給定數據集D上隨機抽取出對象點p,然后查詢p的鄰域半徑Eps內的對象個數,若所含個數大于核心點閾值Minpts,則創建一個以p作為核心對象的聚類簇。p聚簇里的其他對象點作為第二次的查詢對象,依次對聚簇里的其他點進行查詢迭代,尋找新的核心對象和聚類簇,直到沒有新點加入各聚簇即可結束。具體過程如下。

輸入數據集D,Eps鄰域半徑,最小數目MinPts。

輸出生成的聚簇。

步驟1 Repeat。

步驟2 選擇數據集D中一個未作處理的樣本點并識別該點是否為核心對象。

步驟3 若該點為核心對象,且鄰域范圍內的所有點個數大于Minpts,則創建聚類簇。

步驟4 若該點不是核心對象,則回到步驟2尋找新的核心對象和聚類簇;

步驟5 直到沒有新點加入各簇類即可結束。

由于DBSCAN算法是在核心對象的鄰域密度進行迭代擴展,因此對無規則形狀的聚類點來說,使用DBSCAN算法的聚類效果更好。且該算法還具有能有效地識別噪聲點、能識別任何形狀的簇類、聚類結果對遍歷順序幾乎沒有依賴性等優點。

在參數選擇中,由于無需事先指定要劃分的類數,僅需要定義鄰域半徑(Eps)和核心點閾值(Minpts)這兩個參數。在參數Eps值一定時,Minpts值太小會造成簇類太多,而且會把某些噪音點也歸入簇類進而影響結果。相反,若Minpts值過大,則生成的簇類較少,同時也消除了很多非噪音點,所含對象較小的簇類會被忽視。因此,Minpts要取合適值,以減少簇數量和噪聲點的干擾。聚類樣本參數的選取質量可通過輪廓系數來評價,輪廓系數的計算公式為

(1)

(2)

式中:a(i)為樣本i與同簇中其他點之間的平均不相似度;b(i)為樣本i與其他簇之間的最小平均不相似度。

輪廓系數的值介于[-1,1],輪廓系數值與1相近時,表示樣本劃分到的簇合理;輪廓系數值與-1相近時,表示應將樣本i歸到另一個簇中。通過迭代不同的Eps及Minpts,統計該類別狀態,并計算輪廓系數,經過多次實驗取值對比最終確定省級尺度樣本聚類的領域半徑為Eps=0.101,閾值為Minpts=12;市級尺度樣本數據聚類的領域半徑Eps=0.1,閾值為Minpts=11。

2.2 出行軌跡熱點提取及分類

核密度分析常被用來計算指定區域內點、線要素測量值的單位密度,是估計非參數常用方法之一,可以直接反映連續區域離散測量值的分布情況。在核密度分析中,距離其核心要素越近,所獲得的相應密度擴張值也就越高。設x1,x2,…,xn為單元變量x的獨立同分布樣本點,則核密度分析表達式為

(3)

式(3)中:h為距離衰減閾值,即輸出帶寬,h表示距x處直線距離小于或等于h的所有空間對象的數目;k0為核函數;xi為第i個核心對象所在位置。

圖3 熱點區域提取過程Fig.3 Extraction process of hot spots

研究數據源各個時間段提取的熱點區域如圖4所示。根據“自然斷點法”對以上熱點區域分為5個等級,用不同顏色和大小將其可視化,每個顏色對應一個等級,等級越高表示出行活動越弱,效果如圖5所示。

圖4 不同時間不同尺度提取的熱點區域Fig.4 Hot spots extracted at different times and scales

3 多空間尺度融合的城市活動規律分析

尺度效應,即同一區域、同一時間、同一研究對象在某一尺度上呈現出的規律特征、性質等,在另一個尺度上呈現出的結果可能相似也可能有差別。在地理空間中,任何地理實體呈現出的信息承載量都與尺度有關,它們所展示的信息內容因尺度而異。根據地理實體的屬性特征為其選擇合適的空間尺度來進行描述,其結果才會具有研究價值,因此,選取不同省級與市級尺度融合下的出行軌跡數據對其進行城市活動時空分析。

3.1 城市活動時間分布特征

基于DBSCAN聚類算法對出行軌跡數據分出大類簇,結合局部密度峰值計算,提取了不同時段、不同尺度下的出行熱點區域,將統計省級尺度、市級尺度的定位次數總和,以此分析在不同尺度下的出行時間分布特征,如圖6所示。圖6為市級尺度3個時段下的出行軌跡數據熱點區域分布。分析可知,在不同尺度下的時間分布特征如下。

(1)在8:00、12:00、18:00這3個時間段里,密集區域的熱點位置基本重合;強度較低的區域,熱點位置較分散。從城市熱點區域分布圖中得出東南地區3個時間段的熱點區域位置基本重合,西北地區3個時間段的熱點區域位置比較分散,重合度不高。說明不同時間粒度下,在聚集度高的區域活動范圍比較穩定,在聚集度低的區域活動位置偏移大,且移動方向沒有明顯規律。

(2)分別統計了省級尺度、市級尺度在8:00、12:00、18:00這3個時間段中的定位次數。省級尺度18:00的定位總次數為435 270次,市級尺度18:00的定位次數為28 796次,均遠遠高于8:00和12:00點的定位總次數。8:00、12:00、18:00分別處于早高峰、午高峰、晚高峰的時間段里,說明晚高峰是出行軌跡數據強度最大、最頻繁的時段。

3.2 城市活動空間分布特征

基于熱點區域提取結果,將每個區域所擁有的熱點區域個數進行統計,對區域進行分級并進行可視化,如圖7(a)~圖7(c)所示,以此獲得出行軌跡數據在不同尺度下的空間分布特征。省級尺度區域分級標準:擁有10個以下的熱點區域省份劃分為一級行政區;擁有11~20個熱點區域的省份劃分為二級行政區;擁有20個以上的熱點區域省份劃分為三級行政區。市級尺度區域劃分標準:擁有7個以下的熱點區域地級市劃分為一級地級市;擁有8~15個熱點區域的地級市劃分為二級地級市;擁有15個以上的熱點區域地級市劃分為三級地級市。

圖7 不同尺度空間分布特征Fig.7 Spatial distribution characteristics at different scales

可見,不同時間粒度之間的同一行政區的出行密度有所區別。圖7(a)~圖7(c)可以看出,每個等級的行政區在不同時間粒度下,雖然并未出現行政區等級跨越現象。但結合圖7(d)、圖7(e)的熱點區域個數統計圖,可以看出,省級尺度行政區、市級尺度行政區在3個時間段內,同一行政區出行密度是有所區別的,小部分行政區熱點區域個數沒有浮動;大部分熱點區域個數均有浮動,且浮動值較小。因此,從大尺度空間分布看,出行軌跡數據區域范圍是相對穩定的。

同時,各等級行政區分布呈現階梯狀分布。無論是省級尺度還是市級尺度,行政區等級都是依階梯狀逐步排列的。該情況發生的原因是:由于中國地勢東高西低,呈階梯狀分布,且氣候干燥,戈壁沙漠廣布、降水少、風沙多、生態脆弱,社會城市化以及適宜人類居住指數較低,因此導致內蒙古自治區、新疆維吾爾自治區、西藏自治區出現了地廣人稀且居民大散居的現象,所以這3個地區的熱點區域個數較多。中部及東南地區平原和丘陵較多,且社會城市化較高,人類聚集程度較高,因此這些地區的行政區熱點區域個數較少。市級尺度的廣東省地勢北高南低,城市化程度也由北向南逐步升高,因此,廣東省也出現了地級市等級呈現階梯狀分布。

最后,從省級尺度不同時間段的時空分布特征中可以得出:一級省級行政區主要分布在中國東南沿海,二級省級行政區分布在中國中部和東北部,三級行政區分布在中國西北部,各級省級行政區的分布相對聚集。三級省級行政區從低等級到高等級的階梯狀分布。說明東南地區的出行密集,人口密度大;西北地區的出行相對離散,人口密度小。從圖7(a)~圖7(c)可以看出,一級市級行政區主要分布在珠江入口處的城市,二級市級行政區主要分布在一級行政區的周圍,三級行政區主要分布在二級行政區的周圍。由此可見,市級尺度的行政區尺度也呈現出以階梯式聚集分布。說明廣東省珠江入口處城市的出行活動密集,人口密度大;靠近內陸的城市出行活動相對離散,人口密度小。

3.3 城市活動熱點分布特征

結合熱點區域等級圖,獲得每個行政區熱點區域等級并進行可視化。由于在3個時段內,行政區并未出現跨級,因此只需選取18:00這個時刻的省級尺度和市級尺度研究區進行分析。具體如圖8所示。

圖8 熱點分布特征示意Fig.8 Illustration of hot spot distribution characteristics

圖8(a)、圖8(b)分別為市級尺度熱點等級分布和統計情況,圖8(c)為省級尺度熱點等級統計情況,分析可知分布特征如下。

(1)熱點區域等級個數隨等級的升高而增加。等級為1的熱點區域個數最少,等級為5的熱點區域個數最多。結合省級尺度的行政區分析中發現,東南地區的行政區擁有的熱點區域個數少,但熱點區域熱度值高;西北地區的行政區擁有的熱點區域個數多,但熱點區域熱度值低。再次證明了中國東南地區的出行活動密集,人口密度大;西北地區的出行活動相對離散,人口密度小。市級尺度的行政區分析中發現,廣東省珠江入口處的行政區擁有的熱點區域個數少,但熱點區域熱度值高;靠近內陸的行政區擁有的熱點區域個數多,但熱點區域熱度值低。說明廣東省珠江入口處城市的出行活動密集,人口密度大;靠近內陸的城市出行活動相對離散,人口密度小。

(2)熱點區域等級越高,變化越明顯。等級5的熱點區域個數最多,分布的行政區也最多,波動較大;等級4、等級3、等級2隨著熱點等級降低,分布的行政區逐漸變少,波動逐漸變小;直到熱點等級降低到等級1的熱點區域,可以看到此級的熱點個數最少,分布的行政區最少。熱點等級越高代表熱點值越低,因此可以說明在低熱度的熱點區域出行活動不穩定,在高熱度的熱點區域出行活動比較穩定。

(3)為了更進一步驗證在多空間尺度下探究出行軌跡數據分析的可行性,省級尺度研究以胡煥庸線為參照,市級尺度研究以選取的六類POI熱力圖為參照。胡煥庸線北起黑龍江璦琿,南至云南騰沖。胡煥庸線以東是人口稠密地區,人口基數較大,勞動力充足,交通、航運、基建等有一定的基礎。胡煥庸線以西是人口稀疏區域,地廣人稀,交通不便,基礎建設難度高。得出的東南地區與西北地區差異與其一致,符合實際情況。

(4)通過核密度分析得出廣東省餐飲美食、商務住宅、旅游景點、酒店住宿、公司企業、交通設施六大類與出行活動最密切相關的POI熱力圖對比,六大類POI熱度最高的區域都處于珠江入口處的廣州市、深圳市、東莞市。可見,實驗結果得出的廣東省超級熱點區域位于廣州市、深圳市,與POI的實際情況符合,證明本文方法研究人類軌跡規律具有可行性。

綜上,采用基于密度的DBSCAN聚類算法與局部密度峰值法研究出行軌跡數據的時空分布特征。這與軌跡數據中常用的K-means算法相比,該算法主要優勢在于可以對抗噪聲,能準確判別任意形狀簇,而且聚類速度快,不需制定簇的個數就能找到離群點。但選擇的參數對聚類結果有較大影響,且當數據離散分布時會被劃分為多個類,這是算法的不足之處。因此,如何在數據離散分布時,提升聚類精度將是下一步工作主要解決的問題。

4 結論

時空大數據近年來成為研究人類日常活動和城市內部結構的一種新方式。針對軌跡數據挖掘過程中研究范圍單一,以及缺少多空間尺度研究等問題,提出基于多空間尺度融合方法,深入分析不同時間粒度和不同空間尺度下人類出行軌跡的時空分布特征。基于多空間尺度融合方法研究出行軌跡規律,挖掘出更具有普適性和更深層面的出行軌跡時空特征;為利用時空大數據進行相關研究提供了一種可以借鑒的方法。由于使用的TUD數據精度較低,在省級和市級尺度下分析人類活動特征具有良好的效果,但在研究區縣級以下等小尺度上還存在一定的局限性。因此,下一步可通過融合新浪微博簽到數據、Twitter數據等多源時空大數據來提高數據挖掘的精度,這有利于在小空間尺度中展開出行時空變化特征的研究,能夠更精準地揭示出行活動中隱含的時空軌跡信息。

猜你喜歡
區域
分割區域
探尋區域創新的密碼
科學(2020年5期)2020-11-26 08:19:22
基于BM3D的復雜紋理區域圖像去噪
軟件(2020年3期)2020-04-20 01:45:18
小區域、大發展
商周刊(2018年15期)2018-07-27 01:41:20
論“戎”的活動區域
敦煌學輯刊(2018年1期)2018-07-09 05:46:42
區域發展篇
區域經濟
關于四色猜想
分區域
公司治理與技術創新:分區域比較
主站蜘蛛池模板: 91精品专区| 超碰aⅴ人人做人人爽欧美| 2020国产精品视频| 狠狠色丁香婷婷综合| 中文无码精品a∨在线观看| 欧美日韩一区二区在线播放| 国产专区综合另类日韩一区| 国产成人综合亚洲欧美在| 精品国产成人a在线观看| 久青草免费在线视频| 日韩欧美国产成人| 亚洲天堂久久新| 亚洲一区二区三区国产精华液| 99久久国产自偷自偷免费一区| 亚洲国产综合自在线另类| 免费无码AV片在线观看中文| 中文字幕佐山爱一区二区免费| 日韩毛片视频| 日本午夜精品一本在线观看| 熟妇丰满人妻av无码区| 69国产精品视频免费| 国产一级α片| 欧美成在线视频| 免费毛片网站在线观看| 18禁色诱爆乳网站| 香蕉蕉亚亚洲aav综合| 毛片一区二区在线看| 精品福利视频导航| 精品福利网| 久久精品亚洲中文字幕乱码| 亚卅精品无码久久毛片乌克兰| 亚洲大学生视频在线播放 | 99精品久久精品| 国产真实乱子伦视频播放| 亚洲欧美另类专区| 国产一级毛片yw| 色噜噜综合网| 色网站免费在线观看| 久久美女精品| 色亚洲成人| 美女无遮挡免费视频网站| 亚洲天堂久久新| 国产一区二区在线视频观看| 青青草原国产| 日本成人一区| 国产肉感大码AV无码| 无码中字出轨中文人妻中文中| 亚洲国产中文欧美在线人成大黄瓜| 五月天福利视频| 无码一区二区波多野结衣播放搜索| 色九九视频| 色综合激情网| 国产精品极品美女自在线网站| 午夜老司机永久免费看片| 亚洲精品成人片在线观看| 九九精品在线观看| 国产精品亚洲专区一区| 精品久久高清| 麻豆精品久久久久久久99蜜桃| 久久综合五月| 国产精品毛片一区视频播| 蝌蚪国产精品视频第一页| 国产精品30p| 免费99精品国产自在现线| 亚洲午夜国产精品无卡| 最新国产网站| 欧美高清视频一区二区三区| 久久免费看片| 日韩麻豆小视频| 无码中文字幕精品推荐| 无码在线激情片| 国产91无码福利在线| 毛片国产精品完整版| 日韩毛片免费观看| 亚洲天堂日本| 色精品视频| 亚欧乱色视频网站大全| 国产美女精品一区二区| 国模沟沟一区二区三区| 国产麻豆福利av在线播放| 中国国产A一级毛片| 午夜欧美理论2019理论|