林基艷+張雅瓊+張慧



摘 要: 城市居民出行特征分析在城市交通規劃中日益重要,已經成為城市道路交通建設的一個重要依據,而城市出租車因為其運營特點和規律,可以很好地反應出居民出行的特征。因此,為了有效地解決城市道路擁堵問題、為城市交通規劃提供依據,論文提出了基于出租車GPS軌跡數據挖掘的居民出行特征研究,該研究利用DBSCAN算法對出租車歷史GPS運行軌跡數據進行聚類分析,不僅可以提取城市居民出行的時空特征,也可以有效地降低出租車的空載率。
關鍵詞: 居民出行特征; 數據挖掘; GPS軌跡數據; DBSCAN
中圖分類號:TP29 文獻標志碼:A 文章編號:1006-8228(2017)05-37-03
Research on the characteristics of resident travel based on the taxi
GPS trajectory data mining
Lin Jiyan, Zhang Yaqiong, Zhang Hui
(School of Information Technology, Yulin University, Yulin, Shaanxi 719000, China)
Abstract: The analysis to the characteristics of urban residents travel is becoming increasingly important in urban traffic planning, and has become an important basis of urban road traffic construction. The urban taxi can well reflect the characteristics of residents travel because of its operational characteristics and rule. Therefore, in order to effectively solve the problem of city road congestion and provide the basis for city traffic planning, the paper presents the research on the characteristics of resident travel based on the taxi GPS trajectory data mining. The research uses DBSCAN algorithm to realize the clustering analysis of the historical GPS trajectory data, which can not only extract the temporal and spatial characteristics of urban resident travel, but also effectively reduce the taxi no-load rate.
Key words: resident travel characteristic; data mining; GPS trajectory data; DBSCAN
0 引言
在城市的上下班高峰期,道路擁堵是城市交通問題中最為突出的難題,這跟城市居民出行行為密不可分,因為出行的居民是交通量的主要來源[1]。一個城市的交通系統狀況跟城市居民的出行行為息息相關,居民的出行行為會對城市交通體系產生影響[2]。對居民出行特征進行研究是城市和交通規劃、城市公共基礎設施建設管理中的一個基礎性任務,不僅可以用來對目前的交通出行情況進行評估,也可以用來對居民的出行需求進行預測,對實施合理有效的城市交通規劃起著至關重要的作用[3]。
出租車因其靈活性和便利性,已日漸成為城市交通系統的重要組成部分,同時,因為它的起點和終點由乘客決定,且24小時不間斷服務,所以,出租車的運營規律能夠反映出乘客的出行特征[4]。由于裝載在出租車上的GPS和通信設備以一定的頻率向城市交通客運管理中心傳送出租車的實時經緯度、運營狀態、行駛方向、速度等信息,因此,管理中心會積累大量的出租車GPS軌跡數據[5],利用DBSCAN對這些進行數據進行聚類分析,可以在一定程度上挖掘乘客出行的時空特征,也能為出租車尋找最佳的載客區域提供依據,有效的降低出租車的空駛率。
1 GPS軌跡數據挖掘設計
1.1 數據預處理
本文選取榆陽區(地理坐標為東經108?58'-110?24',北緯37?49'-38?58'之間)作為研究區域,GPS軌跡數據使用榆陽區1100多輛出租車五天的運營數據,對數據進行預處理后,出租車軌跡數據由車牌ID tID、、當前位置loc、GPS時間ct、營運狀態tsta、行駛方向tdir、GPS速度dspe等六個屬性組成,部分屬性值如表1所示。
表1中,營運狀態的取值為0-3,其中0表示空載,1表示載客,2表示駐車,3表示停運;GPS方向的取值為000-360,以度為單位,即與北極方向的夾角,代表車輛的行駛方向。
1.2 利用DBSCAN算法進行聚類挖掘
居民的作息和社會活動有明顯的時間規律,比如上下班高峰期的載客點分布情況和非高峰期的居民出行特征有可能完全不同,因此,可以先將GPS歷史軌跡數據根據時間特征分類,再進行密度聚類分析,如此便可充分挖掘在不同時間段上居民出行特征的空間密度分布情況,給出租車提供更加合理的時空載客區域分布數據,有效地提高其巡游過程中的載客成功率。基于此,論文引入了DBBSCAN算法,該算法需要3個輸入參數:歷史軌跡數據對象D,空間半徑ε,以及密度閾值MinPts;輸出參數為聚類簇C,部分MATLAB代碼如下:
data=importdata('data.xlsx');
data=data.data.Sheet1;
……
num=size(data,1);
k=floor(log(num))+1;
k=round(num/25)+1;
k_dist=zeros(num,1);
for i=1:num
temp=repmat(data(i,:),num,1);
gx0=temp(:,1); gy0=temp(:,2);
gx1=data(:,1);gy1=data(:,2);
dist0=sqrt((gx0-gx1).^2+(gy0-gy1).^2);
dist_s=sort(dist0);
k_dist(i)=dist_s(k);
end
x=1:num;
figure;plot(x,k_dist,'r-');
xlabel('?ù±?±à??');ylabel('k_{-}dist');title('k_{-}dist??');
……
x=[(1:m)' data];
[m,n]=size(x);
types=zeros(1,m);
dealed=zeros(m,1);
dis=calDistance(x(:,2:n));
number=1;
……
img=imread('map.jpg');
[Ny,Nx]=size(img);
……
figure;imagesc(x00,y00,img); colormap(gray); hold on;
for i=1:m
if class(i)==-1
plot(data(i,1),data(i,2),'.r');
else if class(i)==1
if types(i)==1
plot(data(i,1),data(i,2),'+b');
else
plot(data(i,1),data(i,2),'.b');
end
elseif class(i)==2
if types(i)==1
plot(data(i,1),data(i,2),'+g');
else
plot(data(i,1),data(i,2),'.g');
end
……
plot(x1,y1,'r*');
xlabel('經度'); ylabel('緯度');
2 實驗結果
聚類結果如圖1和圖2所示,出行熱點區域在圖中用圓圈標出。
以上的聚類結果顯示,榆陽區的居民出行呈現一定空間和時間特征。工作日和非工作日出租車熱點區域不同,且工作日的不同時間居民出行的特征不同;在工作日,出租車的載客熱點數比非工作日多;而載客熱點分布,工作日比非工作日分散。該聚類結果也可以給出租車司機提供歷史載客熱點序列,從一定程度上解決巡游方式的出租車空載率高的問題。
3 結束語
本文利用DBSCAN算法對出租車的歷史GPS軌跡數據進行挖掘,從挖掘結果可以分析出居民出行的時空特征,從而用來對目前的交通出行情況進行評估,同時也可以用來對居民的出行需求進行預測;再者,可以根據挖掘結果給出租車司機提供歷史載客熱點序列,幫助出租車司機降低空駛率。本文僅針對工作日和周末特定時刻給出了聚類分析,沒有詳細地分析一天中不同時刻的居民出行特征,以后的工作中會繼續研究和改進。
參考文獻(References):
[1] 衛龍,高紅梅.基于軌跡數據挖掘的居民出行特征研究進展[J].西部交通科技,2016.10:87-92
[2] 馮琦森.基于出租車軌跡的居民出行熱點路徑和區域挖掘[D].重慶大學,2016.
[3] 陳世莉,陶海燕,李旭亮,卓莉.基于潛在語義信息的城市功能區識別——廣州市浮動車GPS時空數據挖掘[J].地理學報,2016.3:471-483
[4] 張俊濤,武芳,張浩.利用出租車軌跡數據挖掘城市居民出行特征[J].地理與地理信息科學,2015.6:104-108
[5] 張薇,林龍.基于數據挖掘的增城居民出行特征分析[J].科技和產業,2015.7:61-64
[6] 趙苗苗.基于出租車軌跡數據挖掘的推薦模型研究[D].首都經濟貿易大學碩士學位論文,2015.
[7] 童曉君.基于出租車GPS數據的居民出行行為分析[D].中南大學碩士學位論文,2012.
[8] 張俊峰.基于GPS技術的出行OD調查研究[D].北京交通大學碩士學位論文,2011.
[9] 許鐵.數據挖掘在居民出行特征分析中的應用[J].公路交通科技(應用技術版),2007.8:11-14