999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的深圳市地鐵刷卡數據可視化分析

2020-01-03 10:09:02殷瑋宏楊健何兆東黃燕如楊明慧
現代信息科技 2020年14期
關鍵詞:高峰區域分析

殷瑋宏 楊健 何兆東 黃燕如 楊明慧

摘? 要:我國公共交通智能化水平不斷提升,公共交通系統內部產生的海量的運營數據,為城市的規劃發展提供了新的研究視角。通過地鐵刷卡數據的挖掘與可視化,結合網絡拓撲結構分析、OD分析與過度通勤理論,對深圳地鐵的網絡拓撲特性與通勤空間特征進行了研究。研究結果表明,深圳地鐵站點離散分布程度較大,地鐵通勤存在過度通勤的現象,職住區分離現象日趨明顯。

關鍵詞:可視化;地鐵網絡拓撲;地鐵OD;職住分離;通勤時長;數據挖掘

Abstract:The intelligentization of the public transportation in China has been developing continually. The data produced by the public transportation system offers a new angle for research on the city planning. The research is conducted and visualized through the SCD(smart card data),combining network topology,OD and excessive commuting theory. It aims at researching on the network topology and the commuting space features of the metro in Shenzhen. The results show that the degree of the discrete distribution of the metro stations in Shenzhen is great. The phenomenon of excessive commuting exists in subway commuting,and the separation of work and residential areas is becoming more and more obvious.

Keywords:visualization;metro network topology;metro OD;job-housing separation;commuting hours;data mining

0? 引? 言

城市公共交通作為低碳節能的交通方式,有助于降低社會出行總成本,成為國內外解決城市發展過程中面臨的各種交通問題的重要出路,我國更是將城市公交優先發展上升到戰略層面。通過研究乘客在乘坐公共交通工具出行的行為,分析其出行習慣及特征,對于建設更完善的公交服務系統具有重要意義。在互聯網時代,大數據的作用日益凸顯,伴隨公眾出行而產生的海量數據背后蘊含著豐富的信息。

目前國內外對公交出行數據的研究主要針對公共交通智能卡數據(SCD)進行挖掘。SCD數據結構比較簡單,一般包含了乘客的ID、上車/下車具體時間和站點等。相比于傳統的交通出行數據,SCD獲取成本較低、連續性好、覆蓋面廣、信息全面、易于動態更新,且具有地理標識和時間標簽[1]。國內外對SCD數據的挖掘分析工作主要集中在以下幾個方面:(1)推算OD(Origin-Destination)矩陣。這是由于大量城市公共交通采用一票制(flat fare),僅僅要求乘客上車刷卡或下車刷卡,因此造成了出行信息的不完整,需要對數據進行補充,推算乘客出行的OD矩陣,而對于要求乘客上車下車均要刷卡產生的SCD則并不需要過多的推算與補充。(2)公共交通系統的運行與管理。SCD可以幫助決策者更好地理解公交系統的使用模式,從而對公交網絡線路進行更加系統的規劃。如SUN等[2]利用OD矩陣對地鐵時刻表進行了優化。(3)持卡人的出行行為與社會網絡分析,這一領域的研究目前的趨勢是從所有人群到特定人群,從所有行為到特定行為。(4)城市空間結構分析,城市的居住、就業和職住平衡一直是城市研究的重要問題,OTHMAN等[3]利用地鐵刷卡數據實現了軌道交通的智能體仿真系統,研究軌道交通系統中的動力學。ZHOU等[4]基于識別通勤出行,分析了北京的過度通勤。相關研究處于起步階段,且多局限于可視化層次,少有形成機制分析。本研究利用了SCD數據所包含的時空信息進行研究。

1? 研究區域概況

深圳市是中國的經濟特區、全國性的經濟中心城市以及國際化的大都市。位于中國大陸南部,珠三角東部,毗鄰香港。深圳市水陸空鐵口岸完備,是中國擁有口岸數量最多、出入境人員最多、車流量最大的口岸城市之一。截至2015年末,常住人口1 137.89萬,下轄龍崗區、鹽田區、坪山區、大鵬新區、寶安區、光明區、南山區、前海新區、龍華區、福田區、羅湖區。深圳市目前有羅寶線(1號線)、蛇口線(2號線)、龍崗線(3號線)、龍華線(4號線)、環中線(5號線)、西麗線(7號線)、梅林線(9號線)、機場線(11號線)共8條地鐵線路,此外還有2條有軌電車線路,本次研究使用的SCD是來自于地鐵線路的刷卡數據。

2? 數據來源及處理

2.1? 數據來源

原始數據包括了深圳市全市范圍內2015年12月1日的所有IC卡交易記錄表(包括公交、地鐵刷卡記錄,充值記錄),共有14 876 859行。

經過對刷卡數據的初步分析,發現原始數據中存在與本研究無關的數據以及無效數據,經數據清洗后,共提取出了3 987 836條地鐵刷卡數據,截取部分片段展示,如表1所示。其中,IDS代表每個刷卡者的唯一標識符,DTLXNCODE代表刷卡者行為,DTLDATE代表刷卡日期,DTLTIME代表刷卡時間,UNIT代表地鐵線路標識符,LINES代表站點名稱,PNUMS代表車輛標識符。

2.2? 數據處理

2.2.1? 出入站刷卡行為計數

地鐵出入站刷卡行為是反映地鐵客流量的重要指標,對于地鐵通勤情況具有一定代表性。使用Python中的數據分析拓展包Pandas對各站點的出入站記錄進行計數,生成各站點的出入站行為計數表;同時結合深圳交通早晚高峰的時間,生成早、晚高峰出入站行為計數表,并對該計數表進行分區統計,生成各區的早晚高峰出入站行為統計表。

2.2.2? OD矩陣建立

OD表通過特定的標識符,記錄個體在空間中移動軌跡的起點與終點,可以反映個體的出行行為。使用Python提取出入站記錄,配合刷卡者的個人特定標識符,將刷卡者的出站和入站記錄整合,形成OD表;在OD表的基礎上,使用相互連通的站點數據構建網絡數據集,以站點間出入站刷卡次數為權重,建立OD成本矩陣,用于后續的分析。

3? 研究方法

3.1? 深圳市地鐵網絡拓撲結構分析

通過進行網絡拓撲結構分析,可掌握深圳市地鐵的網絡拓撲特性,了解各站點在拓撲網絡中的位置與分布情況。配合后續分析,可以為深圳市地鐵線路的規劃提供一定的參考。

3.1.1? 研究模型

使用Space L方法對深圳市的地鐵網絡進行建模,在Space L模型下,網絡中的各站點僅與相鄰站點通過相鄰的地鐵線路連接[5]。根據2015年深圳地鐵路網,建立地鐵站點的鄰接矩陣(矩陣大小為117行*117列)。將鄰接矩陣導入Gephi,得到如圖1所示的深圳市地鐵網絡拓撲結構圖。

3.1.2? 站點度分布

在Space L模型下,站點的度值用于表示該站點相鄰站點的數目。假設某無向網絡的節點個數為n,則其鄰接矩陣A可以表示為:

使用Excel統計鄰接矩陣中的站點度值,通過對站點度值進行分析,可以得到各站點的度分布情況。

3.1.3? 平均路徑長度

在Space L模型下,站點之間的最短距離指的是在地鐵網絡中連接這兩點的最短路徑所經過的邊數。使用Gephi,計算出深圳市地鐵網絡的平均路徑長度,可以得出地鐵路網的運輸效率。

3.2? OD分析

OD分析通過構建乘客的移動網絡矩陣,描述持卡乘客的出行行為,可以用于城市交通、城市空間結構、職住平衡等問題的研究分析。

使用OD成本矩陣,利用ArcMap在深圳地鐵站點上進行配對連線,得到OD分析圖,使用不同顏色及粗細的線段對刷卡次數進行分級。通過OD分析圖,可以較為直觀地看出通勤的流量情況及其空間特征。

3.3? 過度通勤理論與方法

過度通勤定義為實際平均通勤成本與理論最小平均通勤成本的差值[6],過度通勤率(百分比)的表達式為:

其中,E表示過度通勤率,Ta表示平均實際通勤時間,Tr表示平均理論最小通勤時間。

使用線性規劃求最優解的方法[7],計算理論最小通勤時間。將OD成本矩陣導入Lingo軟件,使用Lingo的線性規劃模型來計算理論最小通勤時間。

在OD表數據的基礎上進行平均通勤時長的計算,利用Python計算乘客的出站時間與入站時間之差的平均值,即得平均實際通勤時間。

4? 研究結果分析

4.1? 深圳市地鐵網絡拓撲結構特征

圖2展示了深圳市地鐵站點的度分布情況。

深圳市地鐵站點的平均度為2.203;其中77.12%的站點的度值為2,為非換乘的小型普通站點,如位于4號線北端的紅山站;度值大于2的站點占比16.10%,這些站點往往位于地鐵網絡的線路交叉處,有換乘的功能,如深圳北站、寶安中心站等地鐵站;其中福田站的度值最大,為5,該站位于1、2、3號線與11號線(在建)的交叉處,是一個大型的換乘站,為深圳市重要的交通樞紐。可以看出,深圳市地鐵網絡呈現出以普通站點為主,中小型換乘站為輔的站點分布格局。

經過計算得出,深圳市地鐵網絡的平均路徑長度為13.805個站點。總體而言,深圳市地鐵從任意一個站點入站,到任意一個站點出站,平均需經過約14個站點,說明地鐵站點離散分布程度較大;這與深圳市中心城區地鐵線網較密集,邊緣城區較稀疏的實際情況相符。

4.2? 地鐵通勤空間特征分析

4.2.1? 地鐵高峰出入站刷卡次數分析

通過對數據的分析,將7:00—9:00、17:30—19:30的兩個通勤流量高峰時段作為早高峰、晚高峰。對比圖3(a)和圖3(b),早、晚高峰刷卡頻率較高的站點分布存在較大的差異,早高峰流量較大的站點主要分布在西方、東北方的地鐵線路,晚高峰流量較大的站點集中在西南方、南方的地鐵線路。顯然,地鐵的入站和出站次數分別代表該站點入站、出站的人數,下面將對出、入站統計數據進行對比分析。

本研究所獲取的數據日期為非特殊節日的普通工作日,對于工作日的地鐵通勤情況具有一定代表性。部分站點的早高峰入站數、晚高峰出站數都較大,并且存在相當數量的重合部分,可以認為這部分重合的站點附近一定范圍是承擔了居住功能的區域,如:坪洲、白石洲、民治、龍華、白石龍、民樂等站。對比站點的晚高峰入站數與早高峰出站數,可發現重合的高峰站點,由此歸為承擔了更多就業功能的區域,主要有:福田、崗廈北、崗廈、購物公園、高新園、深大、科苑、車公廟、大劇院等站。綜合對比,還存在著早晚高峰的出、入站人數相對持平的站點,這些站點附近一定距離的區域也可認為是兼備了就業和居住功能的區域,歸為職住混合區,如:大新、桃園、石廈、福民、蓮花北等站。

4.2.2? 地鐵高峰期客流流向分析

為了進一步分析地鐵通勤的空間分布規律,結合深圳市行政區劃,我們得出了地鐵人流凈流入和凈流出的區域。如圖4所示,深色區域為凈流入區域,淺色區域為凈流出區域,白色區域表示無地鐵通行區域,顏色越深流量越大。可以認為,早高峰期間的凈流入區域為深圳市主要承擔就業功能的區域,這三個區域相連集中在核心位置,臨近關口,毗鄰香港;而主要承擔居住功能的三個凈流出區域分布在外圍,呈現向外延伸擴展的趨勢,工作的區域呈現被居住區域半包圍的空間關系。

4.2.3? 地鐵OD數據分析

如圖5所示,福田、崗廈等站點處于十字交叉中心,以此為中心,在其南北東西向分別延伸的地鐵線路皆為較為密集的深色線條,通勤的流量相對較大。結合前文的分析,將就業和居住集中的區域分別進行標識(半徑為1 km),如圖5所示。可以看到就業集中區主要位于高新區以及福田周圍,而居住區則分散在就業集中區的外圍,呈現類似半環形分布包圍就業集中區。

謝彥敏[6]等在基于地鐵刷卡數據的深圳市過度通勤研究中通過分析2014年2月一周的地鐵通勤數據得出了相應的居住集中區和就業集中區,通過對比,我們發現2015年12月的地鐵通勤數據得出的結果相比2014年2月產生了一些變化,如就業集中區增加了大新、桃園區域。

4.2.4? 過度通勤分析

根據過度通勤的計算方法,得到深圳市基于地鐵通勤的過度通勤率,如表2所示。

從表2可知,深圳市的晚高峰實際通勤時間稍高于早高峰實際通勤時間,總體差距不大;與理論最小通勤時間差距約20分鐘,差距較大;計算得出過度通勤率達63.13%的較高水平,說明深圳市地鐵通勤存在較嚴重的過度通勤現象。結合極光大數據的《2018中國城市通勤研究報告》[8],以及基于地鐵刷卡數據和問卷調查數據的深圳市過度通勤研究[9],對2014、2015、2018年的平均實際通勤時間進行對比,由表3可以發現,深圳市通勤時間及其增長率皆呈上升趨勢,反映深圳市的長距離通勤狀況正在不斷加劇,職住分離現象日趨明顯。

為了進一步分析,本研究截取了17:30—22:30的數據,并以一個小時作為區間,分別計算其平均實際通勤時間,并繪制成如圖6所示的折線圖。

圖6? 17:30—22:30平均實際通勤時間如圖6所示,深圳市17:30—19:30(即晚高峰)的平均實際通勤時間存在一個高峰期,而在20:30—21:30則存在一個次高峰。根據工作人群的實際下班情況可以判斷17:30—19:30期間為大部分人群的正常下班時間,因此對應產生了一個高峰期;而次高峰20:30—21:30則對應加班人群的下班時間,因此繼晚高峰后再次迎來了次高峰。同時,地鐵發車間隔會隨著人流量和需求的增加而適當縮小,此時的通勤效率應有所提升;然而高峰期的平均通勤時間仍然增加,主要是由于通勤人群從刷卡進站到上地鐵的時間延長了,易知人流量也是平均通勤時間的影響因素之一。

結合OD分析,我們選擇了寶安區(典型居住區)西鄉、坪洲(站)至南山區(典型就業區)桃園、深大、高新園(站),共5條線路,分別計算其早高峰、晚高峰、高峰期平均通勤距離及過度通勤率,進行局部分析,數據如表5所示。

其中西鄉—高新園線路的通勤時長與過度通勤率最為逼近深圳市的平均值,其次是西鄉—深大線路、坪洲—高新園線路及坪洲—深大線路,坪洲—桃園線路的平均通勤時長相對較短,過度通勤率較低于深圳市均值。由上文OD分析可知,隨著兩站點間實際通勤距離的增加,過度通勤率也會隨之增高,而以上5條線路中西鄉—高新園線路的實際通勤距離最長,過度通勤率最高,而坪洲—桃園線路的實際通勤距離最短,其過度通勤率也呈現較低值,說明工作區及居住區間的實際距離越長,過度通勤率越高,城市通勤浪費現象越凸顯。

此外,由表5可見各線路的早高峰實際通勤時間及過度通勤率均高于晚高峰。由于早高峰通勤人群的上班時間集中,晚上通勤人群下班時間相對分散,正常下班與加班下班人群之間的通勤存在時差,因此城市中早高峰時的通勤最為集中,通勤壓力最大。針對早高峰交通通勤特點結構進行集中分析,通過減緩早高峰的通勤壓力,從而優化城市的通勤模式,是在未來城市的發展規劃中值得探索的方向。

結合以上分析,可以發現深圳市的工作和居住區域是相對分離的,有較為明顯的職住分離現象。CERVERO R[10]認為就業與住房的不匹配是導致人們長距離通勤的重要原因,特別對于低收入階層而言,無法負擔就業中心周圍的高價住房,只能選擇遠離工作地點的居住區,導致其平均通勤距離要比高收入階層更長。深圳市的職住分離情況對過度通勤現象產生著重要的影響,隨著城市的不斷擴張及郊區化的發展,深圳市的職住分離趨勢必然有所加強,因此如何平衡區域職住功能,比如通過規劃和稅收政策鼓勵在就業集中區建設配套住房,或在居住集中區增加就業崗位等[11],是城市發展中亟待思考的問題。對于城市的發展和規劃來說,平衡區域的職住功能,是緩解城市通勤壓力,提高通勤效率的可探索路徑。

5? 結? 論

本文基于深圳市一工作日地鐵刷卡數據,利用Python等工具對大數據進行挖掘,分析了深圳市地鐵網絡的拓撲結構,使用OD矩陣對客流進行可視化,刻畫了深圳市居民通勤的時空特征,并結合過度通勤理論研究深圳的職住分離情況。研究結果表明,深圳市邊緣城區地鐵線網較稀疏,站點離散分布程度較大;地鐵過度通勤現象與職住區分離現象日趨明顯。因此,在未來的城市規劃中,平衡區域的職住功能,是緩解城市通勤壓力、提高通勤效率的可探索路徑。

參考文獻:

[1] 龍瀛,孫立君,陶遂.基于公共交通智能卡數據的城市研究綜述 [J].城市規劃學刊,2015(3):70-77.

[2] SUN L J,TIRACHINI A,AXHAUSEN K W,et al. Models of bus boarding and alighting dynamics [J].Transportation Research Part A,2014,69:447-460.

[3] OTHMAN N B,LEGARA E F,SELVAM V,et al. Simulating Congestion Dynamics of Train Rapid Transit Using Smart Card Data [J].Procedia Computer Science,2014,29:1610-1620.

[4] ZHOU J P,MURPHY E,LONG Y. Commuting efficiency in the Beijing metropolitan area:an exploration combining smartcard and travel survey data [J].Journal of Transport Geography,2014,41:175-183.

[5] 鄭蘇江.上海市地鐵網絡拓撲結構性質分析 [J].智能計算機與應用,2019,9(4):205-208.

[6] 謝彥敏,錢志誠,陳宇.基于地鐵刷卡數據的深圳市過度通勤研究 [C]//2017中國城市規劃年會.持續發展 理性規劃——2017中國城市規劃年會論文集(05城市規劃新技術應用).北京:中國建筑工業出版社,2017:898-921.

[7] WHITE M J. Urban Commuting Journeys Are Not “Wasteful” [J].Journal of Political Economy,1988,96(5):1097-1110.

[8] 極光大數據.2018年中國城市通勤研究報告 [R/OL].(20 18-06-15).http://www.199it.com/archives/737728.html.

[9] 錢志誠.基于地鐵刷卡數據和問卷調查數據的深圳市過度通勤研究 [D].深圳:深圳大學,2017.

[10] CERVERO R. Jobs-Housing Balancing and Regional Mobility [J].Journal of the American Planning Association,1985,55(2):135-160.

[11] 孟曉晨,吳靜,沈凡卜.職住平衡的研究回顧及觀點綜述 [J].城市發展研究,2009,16(6):23-28+35.

[12] 梁美蘭,郭玉香,胡嘉儀,等.中國城市地鐵網絡特征分析及分類 [J].測繪與空間地理信息,2018,41(11):155-159+162.

[13] 曹庭脈,湯黎明,趙渺希.基于地鐵數據的廣州市職住空間和通勤特征分析 [C]//中國城市規劃學會,重慶市人民政府.活力城鄉 美好人居——2019中國城市規劃年會論文集(05城市規劃新技術應用).北京:中國建筑工業出版社,2019:459-475.

作者簡介:殷瑋宏(1999.06—),男,漢族,廣東佛山人,本科,研究方向:地理信息科學。

猜你喜歡
高峰區域分析
病毒病將迎“小高峰”全方位布控巧應對
今日農業(2021年8期)2021-07-28 05:56:04
隱蔽失效適航要求符合性驗證分析
石慶云
書香兩岸(2020年3期)2020-06-29 12:33:45
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
關于四色猜想
分區域
雨天早高峰,自在從容時。
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
區域
民生周刊(2012年10期)2012-10-14 09:06:46
主站蜘蛛池模板: 在线欧美一区| 午夜啪啪网| 欧美成人午夜影院| 一本久道久久综合多人| 无码日韩视频| 日韩欧美国产成人| 国产亚洲美日韩AV中文字幕无码成人| 欧美成人精品一级在线观看| 精品第一国产综合精品Aⅴ| 日韩国产黄色网站| 精品91视频| 国产亚卅精品无码| 欧美午夜理伦三级在线观看| 欧美亚洲一区二区三区导航| 日韩欧美中文亚洲高清在线| 亚洲人人视频| 永久在线精品免费视频观看| 国产乱人伦偷精品视频AAA| 99视频在线免费看| 黑色丝袜高跟国产在线91| 国产精品片在线观看手机版| www亚洲精品| 国产亚洲欧美在线人成aaaa| 最新国产你懂的在线网址| 日本爱爱精品一区二区| 日韩欧美国产区| 国产办公室秘书无码精品| 日韩麻豆小视频| 久久精品这里只有国产中文精品 | 国产丝袜91| 欧美日本一区二区三区免费| 毛片一级在线| 亚洲免费福利视频| 亚洲高清国产拍精品26u| 日韩国产黄色网站| 国产视频只有无码精品| 欧美日韩资源| A级全黄试看30分钟小视频| 国产欧美日韩综合在线第一| 狠狠亚洲婷婷综合色香| 91口爆吞精国产对白第三集| 国产欧美中文字幕| 福利一区在线| 亚洲欧美日韩中文字幕一区二区三区 | WWW丫丫国产成人精品| 亚洲成aⅴ人在线观看| 亚洲成人精品在线| 国产白浆一区二区三区视频在线| 国产日韩欧美视频| 毛片手机在线看| 国产菊爆视频在线观看| 欧美午夜一区| 黄片在线永久| 欧美日韩亚洲综合在线观看| 毛片网站免费在线观看| 美女被操91视频| 亚洲成人在线网| 日本不卡在线视频| 欧美a网站| 日韩高清一区 | 2018日日摸夜夜添狠狠躁| 国产精品永久在线| 天天干天天色综合网| 一本视频精品中文字幕| 午夜国产小视频| 欧美精品在线视频观看| 国产成人一区免费观看| 大学生久久香蕉国产线观看 | 免费又爽又刺激高潮网址| 亚洲黄网在线| 重口调教一区二区视频| 亚洲黄网在线| 奇米精品一区二区三区在线观看| 国产噜噜噜| 激情无码视频在线看| a色毛片免费视频| 污污网站在线观看| 亚洲无码精品在线播放| 日韩欧美国产成人| 在线观看免费AV网| 国产成人亚洲精品色欲AV| 国产白丝av|