趙瑜,李玉,王利雷,李朋州
(西南交通大學交通工程系,四川成都 610031)
?
基于手機GPS定位軌跡的出行信息采集技術
趙瑜,李玉,王利雷,李朋州
(西南交通大學交通工程系,四川成都610031)
摘要:針對居民出行調(diào)查主要依靠傳統(tǒng)紙質(zhì)問卷形式獲取居民出行信息、調(diào)查數(shù)據(jù)很難準確反映實際交通需求特征的問題,提出運用手機GPS技術獲取個體出行軌跡信息,挖掘分析不同交通方式的軌跡特征,并運用支持向量機算法對出行方式進行識別。結合實例分析表明:提出的算法對步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的出行方式識別正確率均較高,為以后城市居民出行調(diào)查提供一種新型的調(diào)查方法。
關鍵詞:手機GPS;出行軌跡;出行方式識別;支持向量機
近年來隨著我國城市化進程的加快和人口的集聚,交通擁堵問題日益突顯,交通基礎數(shù)據(jù)的采集是解決城市交通問題的重要手段。居民出行調(diào)查是把握城市居民交通需求的基本工具,是交通相關部門制定科學交通規(guī)劃方案和交通政策的重要依據(jù)。
居民出行調(diào)查大多是依靠傳統(tǒng)紙質(zhì)問卷形式獲取居民出行信息,該類方法通過居民回憶出行過程得到調(diào)查數(shù)據(jù),普遍存在數(shù)據(jù)精度不高、被調(diào)查者不愿意配合、調(diào)查組織難度大等問題,調(diào)查數(shù)據(jù)很難準確反映實際交通需求特征。基于GPS定位的個體出行信息采集已經(jīng)逐漸成為交通工程領域國際前沿熱點之一,國內(nèi)外學者對GPS出行信息采集技術與傳統(tǒng)交通調(diào)查技術做了比較研究,并開始對基于GPS軌跡數(shù)據(jù)的出行信息提取算法進行探索。文獻[1]提出結合GIS地圖匹配算法和基于規(guī)則的數(shù)學算法,成功實現(xiàn)了步行、自行車、公交車和小汽車4種交通方式的識別;文獻[2]利用GPS-GIS數(shù)據(jù)開發(fā)一套基于模糊邏輯的交通方式自動識別算法,通過與出行日志對比,該方法對不同交通方式識別的準確率達到90%左右;文獻[3]通過GPS設備收集出行行為特征數(shù)據(jù),運用神經(jīng)網(wǎng)絡算法識別個體出行模式,研究發(fā)現(xiàn)該算法對居民單一交通方式的出行具有較好的識別效果。文獻[4]通過分析GPS軌跡的多源不確定性和高模糊度等數(shù)據(jù)特征,提出一種基于模糊最大隸屬度法則的出行方式識別算法。文獻[5]探討利用手機軟件檢測和記錄的參數(shù),分析出行軌跡特征信息,并對比支持向量機、神經(jīng)網(wǎng)絡、決策樹3種算法對出行方式的識別效果,表明支持向量機具有更好的識別性能,識別正確率為89.6%。文獻[6]通過手機GPS軟件采集GPS軌跡數(shù)據(jù),運用小波模極大值算法將整個出行軌跡劃分成不同的出行段,并運用神經(jīng)網(wǎng)絡算法和公交站點匹配算法對不同交通方式和換乘點進行識別,得出換乘點識別誤差在1 min以內(nèi)、交通方式識別正確率在85%以上的結論。
本文提出運用手機GPS軟件采集移動定位軌跡數(shù)據(jù),并運用支持向量機算法識別提取出行方式信息,形成一整套的出行信息采集與提取技術。
1手機GPS技術
近年來,隨著衛(wèi)星定位技術的快速發(fā)展,基于手機GPS定位的交通數(shù)據(jù)采集技術越來越受到研究人員的關注[7-9]。基于手機GPS的交通數(shù)據(jù)采集技術是指被調(diào)查者攜帶具有GPS功能的智能手機,利用手機內(nèi)置GPS定位芯片計算交通出行者的實時位置,并將數(shù)據(jù)傳輸?shù)教幚碇行模嬎愕贸鏊俣取⒓铀俣鹊染用癯鲂械南嚓P交通信息[10]。該技術作為移動式交通采集技術的一種,相比其他交通調(diào)查方式,可以獲得更為客觀、精確的交通行為特征數(shù)據(jù),并且數(shù)據(jù)更新動態(tài)性更強,數(shù)據(jù)精度明顯提高。此外,該技術避免了手持式GPS儀器成本昂貴的缺點,將成為未來居民出行調(diào)查重要的輔助手段,有著廣闊的應用前景。
2GPS數(shù)據(jù)預處理
由于目前市場上智能手機選用的GPS芯片質(zhì)量參差不齊,GPS定位精度也明顯不同,因而運用手機GPS軟件在數(shù)據(jù)采集過程中會發(fā)生部分數(shù)據(jù)缺失和數(shù)據(jù)飄移等現(xiàn)象,此外,由于在進行實際GPS數(shù)據(jù)采集時,會因為高樓、樹蔭、下穿隧道、高架道路等環(huán)境影響,使獲取的GPS軌跡點出現(xiàn)數(shù)據(jù)突變情況。因此,在挖掘GPS數(shù)據(jù)特征之前,必須結合數(shù)據(jù)除噪算法對基礎數(shù)據(jù)進行數(shù)據(jù)預處理操作。
2.1漂移去除
選取成都市中心城區(qū)的GPS試驗調(diào)查數(shù)據(jù),對不符合成都市地理位置特征的GPS數(shù)據(jù)予以刪除。此外,手機GPS軟件獲取定位數(shù)據(jù)的前提必須保證至少有3顆衛(wèi)星信號。按照成都各級道路的限速規(guī)定,成都市中心城區(qū)的機動車限速為80 km/h。文獻[11]研究得出室內(nèi)手機GPS定位精度為±50 m,數(shù)據(jù)過濾時將定位誤差大于100 m的數(shù)據(jù)清除。綜合考慮,本文主要從經(jīng)緯度、海拔、衛(wèi)星個數(shù)、定位誤差、機動車速度幾個方面進行數(shù)據(jù)漂移除去操作。
通過編寫MATLAB程序,當緯度小于30°05′或者緯度大于31°26′、經(jīng)度小于102°54′或者經(jīng)度大于104°53′、衛(wèi)星個數(shù)小于3顆、海拔高度小于0 m或者海拔高度大于1 000 m、速度大于22.2 m/s時,去除相應的漂移數(shù)據(jù)。
2.2數(shù)據(jù)濾波
GPS軌跡中位置的隨機性影響數(shù)據(jù)后續(xù)處理過程,因此需要進行濾波除噪處理。使用高斯濾波器進行除噪,高斯濾波器是一種在除噪方面比較理想的濾波器,也稱為時頻寬積最小的最優(yōu)濾波器。高斯濾波器在很大程度上克服了傳統(tǒng)濾波相移和設計復雜的缺陷,并廣泛運用到信號數(shù)據(jù)除噪等數(shù)據(jù)預處理領域。高斯濾波器對每一個點的坐標x、y,濾波處理后的值[12]

(1)

(2)

根據(jù)式(1)、(2),編寫MATLAB濾波算法程序?qū)PS軌跡進行濾波處理,對步行-公交車-步行組合出行(即先從出發(fā)地步行一段距離到公交站,然后乘坐公交車,到終點附近的公交站后再步行至目的地)調(diào)查數(shù)據(jù)進行對比分析,最終濾波結果如圖1所示。
由圖1可知,濾波前,當出行時間為17.5 min時公交車的瞬時速度波動最大,幾乎接近18 m/s,而進行高斯濾波處理后,該時間點的瞬時速度約為12 m/s左右,既減少了速度的異常突變,又維持了公交車的速度特征。此外,經(jīng)過處理后出行時間為27 min時的步行速度也減少了突變,各段的速度較為平滑,這為后續(xù)的數(shù)據(jù)特征分析奠定了基礎。
2.3GPS數(shù)據(jù)分析
為了比較分析不同組合出行的GPS軌跡數(shù)據(jù),進行數(shù)據(jù)預處理后,選取了步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS數(shù)據(jù),通過繪制速度-時間折線圖得到:步行速度≤2 m/s,自行車速度為2~4 m/s,公交車速度為10 m/s左右,小汽車速度為15 m/s左右。步行-公交車-步行示例如圖2所示。

圖1 濾波前后的速度-時間折線圖

圖2 步行-公交車-步行組合出行GPS速度特征
3支持向量機算法
3.1支持向量機基本原理
基于GPS軌跡的出行信息識別本質(zhì)上屬于一種非線性的模式識別問題,目前,交通方式識別算法有神經(jīng)網(wǎng)絡、決策樹、模糊識別等,且支持向量機算法在處理非線性問題上具有突出的數(shù)據(jù)挖掘和提取識別能力,獲取結果相對其他算法具有更高的精度[13]。
支持向量機是在統(tǒng)計學習理論中提出的重要機器學習方法,也是目前應用最廣泛、綜合效果最好的模式分類技術。簡單地講,支持向量機算法對模式識別的過程類似于神經(jīng)網(wǎng)絡,其樣本數(shù)據(jù)分類模型結構主要包括3部分[14-15],如圖3所示。其中,φj(X)為訓練樣本X第j個特征函數(shù),K(xj,X)為模型自帶的核函數(shù),其中X=(x1,x2,x3…xm)。
1)輸入層。將m維的訓練樣本數(shù)據(jù)導入支持向量機數(shù)學模型。
2)隱含層。通過對輸入層導入的基礎數(shù)據(jù)進行訓練,生成最優(yōu)的出行模式預測模型。
3)輸出層。運用訓練得到的預測模型,對其他數(shù)據(jù)進行預測識別,最后輸出樣本的識別結果。
3.2非線性支持向量的數(shù)學模型
設樣本集合為(xi,yi),i=1,2,…,n,n為樣本個數(shù),xi∈Rd,yi∈{-1,+1}表示不同類別的標號。由于在d維空間中線性判別函數(shù)的一般形式為g(x)=wT·X+b,其中,w為d維的平面法向量,b為模型初始值參數(shù)。
因此可以得到一個分類面方程[16]
wT·X+b=0。

圖3 支持向量機示意圖
本文中隱含層的預測模型實際上等價于求得一個最優(yōu)化問題,略去具體推導過程[17-18],得到支持向量機的最終數(shù)學模型:

s.t.

最優(yōu)分類函數(shù):

式中:W(α)為目標函數(shù);αi,αj分別為第i個樣本和j個樣本的拉格朗日乘子;K(xi,Xj)為第i個樣本和第j個樣本的內(nèi)積核函數(shù)值;xi、xj分別為第i個和第j個樣本點數(shù)據(jù);yi、yj分別為第i個和第j個樣本點的類別標號;K(xi,X)為第i個樣本與所有樣本的內(nèi)積核函數(shù)值;αi*為實現(xiàn)最優(yōu)分類時的第i個樣本的拉格朗日乘子;b*為確定最優(yōu)解的參數(shù)。
一般而言,非線性支持向量機會因選擇不同的內(nèi)積核函數(shù)而得到不同的模型,常用的核函數(shù)有多項式、高斯徑向基函數(shù)(RBF)、Sigmoid核函數(shù),本文選擇RBF核函數(shù)進行出行信息識別[19],有

4案例分析
4.1數(shù)據(jù)來源
選取四川省成都市人民北路-人民南路南站為GPS數(shù)據(jù)采集試驗調(diào)查線路。該試驗線路全程長約11 km,為雙向6車道主干路,兩側有機動車輔路和非機動車道,呈南北走向,北起人民北路公交站,南至人民南路南站,此線路包括地鐵1#線、16路公交車線等公共交通線路,途徑天府廣場、錦江賓館等商業(yè)中心,是成都市南北交通的主要通道。運用開發(fā)的手機GPS定位軟件采集步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS軌跡數(shù)據(jù),運用支持向量機算法對GPS軌跡中出行方式進行識別。
4.2識別結果
運用LIBSVM工具箱分別對不同組合出行軌跡中的出行方式進行識別。
1)用不同數(shù)字代表不同交通方式。用1、2、3、4分別表示步行、自行車、公交車和小汽車出行方式。
2)構建最優(yōu)支持向量機數(shù)學模型。選擇高斯徑向基核函數(shù),并運用3組公交車、小汽車、自行車速度數(shù)據(jù)進行訓練建模,通過網(wǎng)格尋優(yōu)法獲取搜索步長為50 s,參數(shù)取值c=1,g=0.019(c,g為LIBSVM工具箱自帶參數(shù),初始設置為c=2,g=0.2,需要調(diào)試尋最優(yōu)),從而構建最優(yōu)的支持向量機數(shù)學模型[20]。
3)支持向量機識別出行信息結果。利用支持向量機算法訓練和識別得到各組交通方式識別結果如圖4~6所示。
由圖4可知,步行-自行車組合識別結果與實際結果比較一致。由圖5、6知,公交車和小汽車兩種交通方式識別結果相互干擾,即步行-公交車組合和步行-小汽車組合出現(xiàn)一定的識別誤差。此外,根據(jù)各組識別結果還可以直接讀取步行與機動車之間的換乘點信息。

圖4 步行-自行車-步行識別結果

圖5 步行-公交車-步行識別結果

圖6 步行-小汽車-步行識別結果
對步行-自行車組合、步行-機動車組合的每次出行數(shù)據(jù),運用支持向量機算法進行訓練識別后(每組數(shù)據(jù)識別1次),得到唯一一種結果,并且對識別結果進行統(tǒng)計。已知步行-自行車組合、步行-公交車組合2種組合的實際出行次數(shù)均為14次,步行-小汽車組合的實際出行次數(shù)為12次。運用支持向量機算法分別對14組步行-自行車組合數(shù)據(jù)、14組步行-公交車組合數(shù)據(jù)、12組步行-小汽車組合數(shù)據(jù)進行識別,共識別40次,得到所有出行試驗數(shù)據(jù)的出行方式識別結果,再運用數(shù)理統(tǒng)計方法,得到3種組合出行試驗數(shù)據(jù)的出行方式識別正確率,如表1所示。從表1中可以看出,步行-自行車組合的識別正確率最高,為100%,其次是步行-公交車組合,識別正確率為92.86%,最后是步行-小汽車組合,識別正確率為75%。

表1 不同組合出行方式識別結果
5結語
本文分別采集步行-自行車-步行、步行-公交車-步行、步行-小汽車-步行3種組合的GPS軌跡基礎數(shù)據(jù),通過對軌跡中的速度數(shù)據(jù)進行數(shù)據(jù)特征分析,建立支持向量機數(shù)學模型,對不同組合出行中的GPS軌跡中的出行方式進行識別提取。研究發(fā)現(xiàn):步行-自行車組合的識別正確率最高,為100%,步行-公交車組合為92.86%,步行-小汽車組合為75%。由于公交車和小汽車速度數(shù)據(jù)特征比較相似,導致小汽車識別誤差較大,因此后續(xù)研究需要結合多源軌跡數(shù)據(jù)或者地圖匹配信息,以獲取較高的識別正確率。
參考文獻:
[1]SAREMBAUD A.A trip reconstruction tool for GPS-based personal travel surveys[J].Transportation Planning & Technology, 2005, 28(5):381-401.
[2]TSUI S,SHALABY A.Enhanced system for link and mode identification for personal travel surveys based on global positioning systems[J].Transportation Research Record Journal of the Transportation Research Board,2006, 1972(1):38-45.
[3]BYON Y, ABDULHAI B, SHALABY A.Real-time transportation mode detection via tracking global positioning system mobile devices[J].Journal of Intelligent Transportation Systems,2009, 13(4):161-170.
[4]徐超,季民河,陳雯.GPS軌跡中交通方式的模糊識別及算法實現(xiàn)[J].中國科技論文在線,2011, 4(21):1938-1945.
XU Chao,JI Minhe,CHEN Wen.Identifying travel mode from GPS trajectories through fuzzy pattern recognition[J].Sciencepaper Online, 2011, 4(21):1938-1945.
[5]汪磊,左忠義,傅軍豪.基于SVM的出行方式特征分析和識別研究[J].交通運輸系統(tǒng)工程與信息,2014, 1(3):70-75.
WANG Lei,ZUO Zhongyi,F(xiàn)U Junhao.Travel mode character analysis and recognition based on SVM[J].Journal of Transportation Systems Engineering and Information Technology, 2014, 14(3):70-75.
[6]YANG F, YAO Z,JIN P J.GPS and acceleration data in multimode trip data recognition based on wavelet transform modulus maximum algorithm[J].Transportation Research Record Journal of the Transportation Research Board,2015,2526:90-98.
[7]李勇.GPS全球衛(wèi)星定位導航系統(tǒng)的發(fā)展與應用[J].電腦知識與技術,2007(18):1640-1641.
LI Yong.Development and application of global positioning system-GPS[J].Computer Knowledge and Technology,2007(18):1640-1641.
[8]田永軍,賈國慶.A-GPS定位技術在智能手機中的研究與應用[J].科技信息,2009(4):160.
TIAN Yongjun,JIA Guoqing.Application research on A-GPS positioning technology in the smart phone[J].Science and Technology Information,2009(4):160.
[9]夏熙梅.差分GPS定位技術及應用[J].現(xiàn)代情報,2002,22(3): 99-100.
XIA Ximei.Differential GPS positioning technology and its application[J].Modern Intelligence,2002,22(3):99-100.
[10]SU Ya,YANG Yanlan, WU Xiaojia, et al.Design and development of android-based mobile positioning software[J].Computer Science &Application,2013(3):17-22.
[11]謝翔, 荊昊, 郭際明.室內(nèi)環(huán)境下手機GPS定位精度研究[J].測繪通報, 2012(8):95-98.
XIE Xiang, JING Hao, GUO Jiming.Research on accuracy of indoor-mobile-GPS positioning[J].Bulletin of Surveying and Mapping, 2012(8):95-98.
[12]連仁包,王衛(wèi)星.一種異性擴散的自適應平滑濾波算法[J].計算機工程與應用,2013,49(20): 141-144.
LIAN Renbao, WANG Weixing.Anisotropic diffusion and adaptive smoothing algorithm[J].Computer Engineering and Applications, 2013, 49(20):141-144.
[13]ADREW A M.An introduction to support vector machines and other kernel-based learning methods[J].AI Magazine,2000,32(8):1-28.
[14]CORTES C, VAPNIK V.Support-vector networks[J].Machine Learning, 1995, 20(3):273-297.
[15]BOSER B E, GUYON I M, VAPNIK V N.A training algorithm for optimal margin classifiers[J].Proceedings of Annual Acm Workshop on Computational Learning Theory,1996(5): 144-152.
[16]王定成.支持向量機建模預測與控制[M].北京:氣象出版社, 2009.
[17]趙風治,尉繼英.約束最優(yōu)化計算方法[M].北京: 科學出版社,1991.
[18]杜樹新,吳鐵軍.模式識別中的支持向量機方法[J].浙江大學學報(工學版),2003, 37(5): 521-527.
DU Shuxin, WU Tiejun.Support vector machine method in pattern recognition[J].Journal of Zhejiang University(Engi-neering Sience),2003, 37(5):521-527.
[19]趙瑩.支持向量機中高斯核函數(shù)的研究[D].上海:華東師范大學, 2007.
ZHAO Ying.The research of gaussian kernel function of the support vector machine[D].Shanghai:East China Normal Univer-sity, 2007.
[20]ZHUANG L, DAI H.Parameter optimization of kernel-based one-class classifier on imbalance learning[J].Journal of Compu-ters,2006,1(7): 434-443.
(責任編輯:楊秀紅)
收稿日期:2016-05-17
作者簡介:趙瑜(1989—),男,重慶人,碩士研究生,主要研究方向為智能交通技術與應用,E-mail:zhaoyu.mail@163.com.
DOI:10.3969/j.issn.1672-0032.2016.02.003
中圖分類號:U491
文獻標志碼:A
文章編號:1672-0032(2016)02-0012-07
Travel Information Collection Technology Based on Mobile Phone GPS Trajectory
ZHAOYu,LIYu,WANGLilei,LIPengzhou
(DepartmentofTransportationEngineering,SouthWestJiaotongUniversity,Chengdu610031,China)
Abstract:The traditional resident travel survey mainly relies on paper questionnaires to obtain the resident travel information. The survey data are hard to reflect the characteristics of the actual traffic demand accurately. In this paper, the mobile phone GPS technology is used to collect individual travel path information through the analysis of the trajectory characteristics of different transport modes. Then, the support vector machine (SVM) algorithm is used for the travel mode identification. Combined with the case analysis, the research shows that the proposed algorithm gets higher extraction accuracy for three kinds of combination travel ways: walking-bike-walking, walking-bus-walking and walking-car-walking, which provides a new method for the urban resident trip survey.
Key words:mobile phone GPS;travel trajectory;travel mode identification;support vector machine