谷朋飛 李俊異 張特森 戚將軍





摘 要:本文使用Python爬取高德地圖的交通態勢,收集了成都來渝方向高速路段4周的路況數據,以交通態勢路況指數為指標對數據進行路網地圖可視化,發現某些地區高速公路與城市道路的銜接地段較為擁堵,并初步細化了地區內的擁堵區域;以平均行程速度為指標驗證了上述的擁堵區域。結果證明:成渝環線高速(白市驛互通到西環立交段與賴家橋立交到渝遂互通段)擁堵問題比較嚴重,對這幾個互通區域的銜接道路以及周邊路網進行協同研究。
關鍵詞:交通態勢;Python;平均行程速度
0 引言
近年來,隨著重慶城市化、機動化進程的加快和“成渝雙城經濟圈”等國家戰略規劃的提出,促使城市間和區域內的人流量、車流量、信息流量快速增加。截至2020年底,重慶高速公路總里程數已達到3 400公里,省際出口通道由13個增加到24個,汽車保有量已經突破500萬輛,這對重慶市高速公路與城市道路銜接提出了更高的要求。高速互通交通路況的擁堵程度是判斷高速公路與城市道路銜接是否合理的一個重要標準,所以本文將對重慶境內的成渝環線高速擁堵路段以及擁堵程度進行細化與分析。
1 交通態勢數據爬取
1.1 交通態勢簡介
交通態勢數據是一類由高德提供的GPS點數據,經過ArcMap可視化后,可以反映道路的實時路況。數據中包含2個重要指標,分別是交通態勢指數和平均行程速度。交通態勢指數分為“0,1,2,3”,“0”表示路況未知路段,“1”表示路段暢通,“2”表示道路輕度擁堵,“3”表示道路重度擁堵;平均行程速度是一條道路上的某一區間路段的平均行程速度。
1.2 基本流程
(1)發送請求:申請“Web服務API接口”密鑰(Key);拼接HTTP請求URL,申請的Key作為必填參數一同發送。
(2)獲取響應:接收HTTP請求返回的數據(JSON或XML格式)。
(3)解析內容:主要是將爬取出來的數據進行解析,存入文件。
(4)保存數據:保存至數據庫。本文將獲得的交通態勢數據保存為CSV類型文件。
1.3 實現方法
本文使用Python編碼爬蟲程序事先采集了成渝環線高速(重慶段)四周的路況數據,主要操作步驟如下:
首先,調用Python爬取模塊當中所需的第三方庫,包括requests,pandas,json,time模塊。
其次,采集區域劃分。本研究區域為成渝環線高速(重慶段)的范圍,西南角的經緯度坐標為(106.227 817,
29.457 999);東北角的經緯度坐標為(106.502 819,29.687 256);但由于高德地圖的矩形采集區域限制為對角線不超過10公里,故采用網格切分的思想,先將采集區域進行分割,劃分為幾個較小的采集區域。本文依據實際的面積大小,將采集區域劃分為4*4區域(如圖1所示),然后使用for... in range對每一個方格區域,進行循環依次采集。
最后,將運行的結果數據儲存為csv文件,如圖2所示。
c=pd.DataFrame(x,columns=['路名','交通態勢','速度','經度','緯度','編號'])
c.to_csv('C:/Users/Learning/Desktop/交通態勢/traffic.csv',encoding='utf-8-sig')
2 數據預處理
數據分析的成功與否,取決于采集的數據能否真實反映研究對象的情況,所以數據預處理是數據分析的重要一環。存在質量問題的數據即缺失值。缺失值主要包括數據記錄的整體缺失,或者記錄中的關鍵值字段缺失。處理方式分為兩種,刪除記錄和缺失值插補。
本文對采集到的行程速度進行預處理。如果采集到的交通態勢指數或平均行程速度不完整,關鍵路段值缺失,則需要對缺失值處理;處理的方式包括刪除記錄和數據插補。采集的數據缺失整條路的交通態勢指數或平均行程速度值字段,即平均行程速度值字段為None,則刪除該記錄;若采集的數據缺失某點數據,則需要采用數據插補的方式。本文采取最近鄰插補的方法,即在記錄中找到與缺失樣本最接近的樣本的平均行程速度進行插補。
3 數據可視化
3.1 交通態勢數據地圖化處理
首先,打開ArcMap軟件,將爬取的某一時刻交通態勢數據以XY數據的形式導入,XY坐標分別對應經度和緯度,坐標系設置為WGS-84,點擊確定之后,即可看到CSV文件成功的轉換為了點要素文件(如圖3)。其次,將該要素導出為SHP文件,接下來是利用點集轉線工具將交通態勢點轉換為線,將除高速之外的路段數據剔除,然后對路況依據交通態勢指數進行標注(如圖3,紅色為嚴重擁堵路段,黃色為較為擁堵路段,綠色為暢通路段)。
通過將四周的交通態勢數據地圖化處理,可以發現早高峰擁堵程度較為嚴重的區域有:渝遂互通和西環立交;晚高峰擁堵程度較為嚴重的區域有:渝遂互通、西環立交、白市驛互通和西永互通。接下來利用渝遂互通、西環立交、白市驛互通和西永互通四個區域的平均行程速度分布進行驗證。
3.2 平均行程速度分布處理
從高德開放平臺上爬取到的交通態勢數據中的速度數據,是一條道路上的某一區間路段的平均行程速度,而互通區域可能包含多個區間段,所以需要對平均行程速度進行計算。計算公式為:
其中,表示某條道路某方向的平均行程速度,單位為km/h;D表示區域內道路的分段數;表示某一區間路段的平均行程速度,單位為km/h。
利用平均行程速度計算公式分別計算互通區域與環線高速相交路段早晚高峰的平均行程速度,以下為其中一周數據的計算結果(如圖4所示)。
由以上5個高速互通區域路段一周的平均行程速度可以看出,早高峰時段,西環立交和渝遂互通的平均行程速度分布在30 km/h~40 km/h,白市驛互通和西永互通的平均行程速度分布在40 km/h~60 km/h;晚高峰時段,渝遂互通、西環立交、白市驛互通和西永互通的平均行程速度分布在30 km/h~40 km/h;物流園互通在早晚高峰時段的行程速度分布在90 km/h~95 km/h。
4 結論與討論
通過對交通態勢指數數據進行地圖化處理,篩選出擁堵程度比較嚴重的區域,并對區域內的成渝環線高速路段計算平均行程速度,結果發現,渝遂互通、西環立交、白市驛互通和西永互通早晚高峰的平均行程速度與其他互通區域相比較低,由此可以得出,成渝環線高速(重慶境內)早高峰擁堵嚴重的區域為渝遂互通和西環立交,較為擁堵的路段為白市驛互通和西永互通;晚高峰擁堵嚴重的區域為渝遂互通、西環立交、白市驛互通和西永互通。
本文以高德交通態勢數據為基礎,主要確定了早晚高峰時段成渝環線高速在重慶市的擁堵路段分布以及擁堵程度,接下來以文章中提及到的擁堵區域為中心,重點研究高速公路與城市道路銜接中存在的問題。
參考文獻:
[1]賀席燕,趙航,黃紅良.貴陽市道路擁堵狀態時空分布規律研究——基于出租車GPS大數據[J].人文地理,2018,33(3):112-120.
[2]盛宇裕,畢碩本,范京津,等.運用交通運行狀況指標分析交通熱點時空模式[J/OL].武漢大學學報(信息科學版):1-11[2021-05-18].
[3]丁濤杰,史殿習,李永謀.基于出租車GPS數據的道路平均速度估計方法[J].計算機技術與發展,2015,25(7):15-19.
[4]胡立偉,楊錦青,何越人,等.城市交通擁塞輻射模型及其對路網服務能力損傷研究[J].中國公路學報,2019,32
(3):145-154.