胡悅 陳露露
摘 要:復雜的交通流系統下的城市結構表現出城市內部固有的聯系模式。文章以國內某市大量出租車出行數據為基礎,構建空間嵌入網絡模型,對城市內部空間互動進行建模,并引入網絡科學方法,分析城市交通出行規劃。
關鍵詞:出租車;大數據;出行規劃
0 引言
城市與交通是一個不可分割的整體,它們相互影響,共同發展。在社會經濟快速發展的背景下,城市化進程加快,規模逐步擴大,機動化水平逐步提高。基于這種情況,國家提出了更高的標準來改善城市化地區的交通。中華人民共和國成立70多年來,特別是改革開放40年來,中國城市交通建設取得了舉世矚目的成就,城市交通服務水平不斷提高,城市居民生活方式多元化。
1 我國城市交通與出行規劃發展現狀
1.1? 城市交通概況
幾十年來,駕駛一直是世界絕大多數地區到達目的地的主要方式,導致全球汽車數量不斷增加,中國也不例外。截至2018年,中國的汽車保有量自2007年以來翻了兩番,這給全國的公路網帶來了巨大負擔。在北京和上海,人們的上班時間平均需要50分鐘左右。以北京為例,高峰時段的平均行車速度可低至26.48 km/h。
1.2 出行規劃方式
城市結構與其居民的城市內出行模式密切相關。城市內部的資源配置產生了出行需求,推動了人們的出行,而出行流量則相反地表明,需要改變現有的生活環境,建設新的交通設施。在實地調查、遙感和政策咨詢等方法的基礎上,城市形式比旅游數據更容易獲取。因此,與旅游行為對城市結構的影響相比,更多的研究集中在城市結構對旅游行為的影響上。從手機記錄、社交媒體登記和出租車軌跡等來源收集大型地理空間數據,為人們在城市周圍的移動建模提供了豐富的位置。與傳統的旅游調查數據相比,大數據更準確、客觀、豐富、經濟、易用,為更好地描述人們的出行提供了機會[1]。
2 大數據技術與出租車司機手機定位
2.1 大數據技術
大數據是一個術語,它描述了大量的數據,這些數據每天都會淹沒企業。但重要的不是數據量,重要的是組織如何處理數據,對大數據進行分析,以獲得有助于做出更好決策和戰略業務舉措的見解。
2.2 出租車司機手機大數據定位
目前大多數出租車司機都以手機作為導航和接單的工具。在過去的幾年里,手機得到了迅速的發展。今天,手機已經成為我們生活中不可或缺的一部分。大多數人無論走到哪里都帶著這些設備,即使是在睡覺的時候,他們也希望手機在身邊。根據調查報告,這種使用習慣使手機成為一種全天收集消費者信息的有用設備。對一些人來說,手機已經成為他們上網的主要方式,這使得它成了解消費者更有效的方式。
大數據的概念是將不同來源的有價值的信息匯集在一起,唯一的目的是對你可能感興趣的一個人或一群人得出有意義的結論。隨著移動設備在國內的普及,了解消費者行為的機會也在增加,廣告商和營銷人員現在可以瞄準對他們所提供的產品感興趣的特定人群。
這些信息不僅對廣告商和營銷人員有用,而且對應用程序開發人員也有用。像百度、阿里巴巴這樣的大數據分析公司,將各種移動應用程序作為他們的信息源,然后這些信息在數據倉庫中聚合在一起。作為回報,開發人員從數字倉庫中提取信息,用于自己的消費和開發應用程序的改進[2]。
城市是居民和手機用戶聚集的地方。與其他大數據優勢相比,它與城市規劃的兼容性更多地體現在完整的樣本,實時、動態且無群體差異方面。
移動信令是移動用戶與廣播基站或微型站之間的通信數據。打開電話并在電話屏幕上顯示話務員的字樣(中國移動、中國聯通和中國電信)時,將生成信號數據。數據字段始終包含大量的時間和位置信息,并且無法手動定義和分析。過去,這樣的歷史大數據除了保護和破壞之外,對運營商沒有任何影響。手機信號數據具有以下特征:客觀性、連續性和準確性。在智能手機的支持下,移動大數據技術使用信息數據分析方法對手機響應、短信、信號平臺和其他數據內容進行全面的數據分析,以支持數據技術的規劃,開發和相關研究。
3 基于出租車大數據的城市交通出行規劃的具體方案
3.1? 交通導航網絡建設與社區道路檢測
城市中的人流將分散的地方連接成一個完整的系統。雖然我們知道客戶被出租車接送的確切位置,但客戶來自或前往的確切地點或建筑卻不得而知。假設一個小的空間單元通常具有相同的土地利用,我們可以聚合出行來獲得這些小區域之間的空間相互作用。小單元可以是交通分析區、網格或按主要道路分割的地塊。通過將單元視為節點,將運動流視為邊緣,我們可以構造空間嵌入式網絡,并應用復雜網絡方法進一步研究它們的性質和結構。
為了從出租車出行中構建一個網絡,將研究區域劃分為小區域,每個小區域對應于網絡中的一個節點。如果從一個節點到另一個節點有滑行,則兩個節點之間存在有向邊或連接。一條邊的權重等于它所代表的出租車出行量,因此網絡的性質反映了城市的結構和小區域之間的空間相互作用。該網絡分為4個部分,其中子網絡具有相對密集的連接。群落檢測結果對應于緊密相連的子區域。
在網絡中,一些節點表示它們之間的連接比其他節點強得多。通過將出租車出行網絡劃分為密集連接的子網絡,我們能夠將城市劃分為高度互動的子區域。在網絡科學中,社區檢測方法能夠將整個網絡劃分為緊密連接的子網絡,稱為社區,并揭示網絡的聚類特征。社區檢測可以使用許多算法來實現,其中Infomap算法能夠處理加權和有向網絡,并且執行穩定和快速。它對網絡上的隨機游動采用兩級描述,目的是最小化隨機游動的預期描述長度或“代碼長度”。優化的兩級描述對應于網絡的社區結構。
3.2? 城市地圖構建
我們首先構建了一個包含數據集中所有出租車出行的網絡。群落檢測結果主要由大的空間連續區域組成,表明距離衰減效應對空間相互作用的影響。郊區的一些小鎮也屬于大型城市社區,因為與城市之間很少有長途旅行。小社區主要存在于郊區和農村地區,因為出租車出行量低。城市地區的社區很大,可能會隱藏詳細的結構。為了檢測出詳細的結構信息,我們從以下3個方面對短途旅行進行了研究。首先,短途旅行將當地聯系起來,可能有助于找到更小的區域。其次,短期和長期的城市內旅行往往有不同的目的和旅行模式,特別是在一個大城市,如上海。最后,大部分出租車行程較短(一半的行程短于4.72km,四分之三的行程短于8.32km)。它們代表了緊密地點之間的空間相互作用,因此可以更詳細地描述城市結構。短途和長途旅行的不同模式可以通過一些簡單的分析得到證實。例如,按中位數長度(4.72 km)將所有出行分為兩個子集,并將它們命名為短出行集和長出行集,結果它們的交通量顯示出不同的時間分布[3]。
短途旅行在下午2點左右達到較高的交通量峰值,而長途旅行在夜間的交通量較大。特別是在出行豐富的城市地區。這一模式意味著短途旅行主導了當地的空間互動,而長途旅行則起著連接這些當地集群的作用,而不是遵循同樣的短途旅行模式,維持子區域的擴張過程。
3.3? 大數據支持下出行規劃的方案
MapReduce框架本身將根據鍵值對處理結果排序,對于本文中的出租車大數據,需要根據車牌號和時間這兩個屬性對清洗后的數據進行兩次排序,以提取出租車乘客的軌跡。
第一步是完成數據清理工作后,使用MapReduce中的inputSplit()方法拆分要排序的數據,并將每個切片分配給map子任務,然后將其作為值輸入相應的map函數。第二步是將輸出的中間數據輸入緩沖區,其中,處理每個記錄后需要執行一次該過程。第三步是使用隨機播放機制將映射面的輸出結果有效地傳輸到歸約面。第四步是reduce端在完成諸如合并排序之類的一系列任務之后將數據分組輸出,并且不同的鍵值對應于不同的組。
4 結語
復雜的交通流系統下的城市結構表現出城市內部固有的聯系模式。本文以國內某市大量出租車出行數據為基礎,構建空間嵌入網絡模型,對城市內部空間互動進行建模,并引入網絡科學方法。通過從出行模式的角度結合中心的土地利用,我們進一步研究了次區域形成和中心—地方互動模式,對城市交通出行規劃進行了分析。
[參考文獻]
[1]李潔.出租車大數據在城市交通中的運用分析[J].建筑工程技術與設計,2018(4):2346.
[2]紀麗娜,陳凱,于彥偉,等.基于城市交通大數據的車輛類別挖掘及應用分析[J].計算機應用,2019(5):1343-1350.
[3]王冷.基于大數據分析的教育智庫搭建[J].現代教育論壇,2020(7):86-88.
(編輯 王雪芬)