陳儉新,趙紅領,李潤知,李春雷,王宗敏
(1.鄭州大學 河南省高等學校信息網絡重點學科開放實驗室,河南 鄭州450000;2.鄭州大學 信息工程學院,河南 鄭州450001;3.中原工學院 電子信息學院,河南 鄭州450007)
出行模式識別主要根據出行者的行為特征及位置信息對出行方式進行分類,識別結果能夠為智能交通精細誘導、實時路況以及市政決策提供有力依據[1,2]。文獻 [3-5]使用專業GPS設備采集數據,采購專用設備增加實驗開銷,出現位置參數偏移時校準困難,數據存儲空間受限。移動互聯網技術通過移動終端對出行數據進行采集,具有快速部署、成本低、數據傳輸便捷的優點;文獻 [6]通過智能終端采集GPS、加速度傳感器、磁場傳感器、溫度參數,該方法所用統計方法復雜,算法收斂速度慢;文獻 [7,8]將移動端采集GPS數據與路網信息結合,在路況擁堵情況下,通過GPS提供的車速、距離參數難以區別不同交通方式;鄭宇等[9]采用基于圖論的后處理算法對移動終端采集的GPS 數據進行分析,但未對GPS 位置數據進行糾偏處理。
本文基于移動互聯網技術,提出了一種改進的出行模式識別方法。該方法通過移動終端采集了詳細的出行GPS參數和加速度參數,綜合選擇處理后的速度值和三軸加速度值作為出行方式識別特征。隨后,本文提出了一種改進的BP神經網絡算法—ALBP算法,進一步提高了算法效率和識別效果。另外,根據國內外主要交通方式現狀,本文增加了對電動自行車出行方式的識別。
采集到的速度數據序列為 (V1,V2,…,Vn),為了防止GPS采集的瞬間誤差,選取3 個最大速度取平均值,如式 (1)所示

速度中值VMID為當次GPS 采集到的所有數據的中間值,在速度數據序列 (V1,V2,…,Vn)中通過排序得到。
本文平均速度VAVG選取一段時間的總路程L 除以時間T

由于GPS返回的是地球的經緯度,這里使用Haversine公式根據起止點 (S,D)經緯度計算路程[4]如式 (3)所示

其中,S(s,Фs),D(d,Фd):s,d 分別為起止點的緯度,Фs,Фd分別為起止點的經度,R 為地球半徑。
5種不同的出行模式在出行暢通情況下可以通過GPS速度信息加以識別,但在某些情況下,如堵車等,每種交通方式在速度上很難顯示出其獨特的特征,加速度特征是每種交通方式特有的特征[4,10],5種交通方式垂直方向上加速度特征如圖1所示。步行和自行車的波動性特征最為顯著,電動車和小汽車波動性比步行小,公交車最為穩定,波動性最小。針對文獻 [2]中提到數據采集設備必須按照垂直等方式放置來采集三軸加速度的問題,通過取模的方式能夠很好的消除這種方法采集數據的軸間數據干擾。公式如下

式中:(Marx,Mary,Marz)——某種交通方式三軸的幅度值。
方差能夠表示不同出行方式的波動性特征,值越大,波動性越大[6]。本實驗首先分別計算3 個方向上的方差,如式 (5)所示

圖1 5種出行方式垂直方向上加速度典型波動

本組共1到n,共n個值,A1到An為某方向上加速度值,AAVG為同一方向上加速度平均值。為了避免設備放置方向帶來的波動性干擾,三軸加速度方差同樣采用類似取模的方法

式中:(Varx,Vary,Varz)——某種交通方式三軸的加速度方差。
為了使手機的放置位置不影響加速度數據的采集,本文采用三軸加速度取模的方式處理三軸加速度[3]

式 中:Accelmag——三 軸 加 速 度 的 模,(Accelx,Accely,Accelz)——三軸加速度。
BP神經網絡有較強的學習能力,能夠對含有噪聲及不確定因素的數據建立高維非線性映射關系,被大量應用于解決實際問題[11,12]。由于傳統BP 神經網絡有:收斂速度慢、假飽和、穩定性差、容易陷入局部最小的缺點[13]。本文提出了一種改進的BP神經網絡:ALBP算法用于出行模式識別,該方法通過自適應學習率和動量項提高了網絡的學習效率和穩定性。
BP神經網絡主要分為學習數據的正向傳輸與權值的反向調整兩個階段,學習數據正向傳輸階段,輸入值通過隱層到達輸出層由激發函數輸出,權值不變;神經網絡根據允許誤差值的大小判斷是否進行反向調整,若需要調整,網絡根據誤差信號的大小進行的調整。通過不斷的學習、調整,使得神經網絡學習結果與目標之間的差距縮小在一定范圍內[14,15]。
BP神經網絡輸入輸出關系如下

其中,αk-1(j)為第k-1層第j個神經元的輸出,wk(i,j)為第k層第i個節點對應第j 個輸入的權值,θk(i)為第k層神經元的閾值,μk(i)為神經元的輸入,函數f(x)為激勵函數。
網絡在輸出層得到的實際輸出為γ(k),訓練數據的目標輸出為β(k),誤差為

神經網絡根據誤差δ(k)的大小判斷是否進行反向權值調整以及調整量的大小。
傳統BP神經網絡權值調整公式為

式中:Δω(k)——第k次迭代權值的修正量,η——學習率,E(k)——第k次迭代的誤差,ω(k)——第k 次迭代的連接權值,ν(k)——激勵輸出。
BP神經網絡采用梯度下降法調整權值時,如果誤差曲面上會存在梯度近似為零的點,此時的誤差能夠滿足局部最小。根據式 (11),此時權值的變化量隨著誤差的減小而達到極小,造成網絡已經到達最優的假象。通過添加動量項,避免了權值調整過分依賴學習率的現象。添加了動量項的權值修正公式如下

其中,λ*Δω (k-1)為動量項。由式 (12)可知,動量λ能夠表示上次權值變化量對本次權值的影響程度。如果前一次修正量過大,可以通過調整λ的方法減少本次修正量,達到了減少振蕩的效果,反之亦然。
增加了動量和學習率的BP神經網絡已經成為目前BP神經網絡中的一種重要實現形式,本文基于可變學習率的反向傳播算法改進得到自適應學習率的反向傳播算法,通過自適應改變學習率的大小加速網絡收斂速度。由于誤差曲面的隨機波動性以及對神經網絡收斂速度的不同要求,在神經網絡學習過程中使用統一的學習率η 和動量λ 不能根據誤差大小及時調整網絡收斂速度。根據傳統BP神經網路誤差函數的梯度特性,使得在誤差曲線稀疏的地方,誤差下降緩慢;如果神經網絡采用固定學習率,若學習率η過小時,權值收斂過慢,η過大將可能使權值跳過最優學習率產生震蕩現象。
神經網絡訓練過程中,若本次訓練誤差E(k)大于上次誤差E(k-1)的ξ倍 (ξ取值在1.01到1.10之間)[14],表明本次訓練權重增加過大,應立即減小,避免越過梯度曲面最佳權值;若本次訓練誤差E(k)小于上次誤差E(k-1)的 (2-ξ)倍,表明誤差正在減小,需要增加學習率以加快收斂速度[14];故學習率大小與誤差變化量及上輪訓練的學習率相關。本文對學習率的改進公式如下

式中:ε——學習率的初始值;N,M——兩個集合

若E (k)∈N 表示本次誤差相對于上次誤差正處在穩定范圍內則保持學習率,即本次學習率η(k)與上次學習率η(k-1)相同;若E(k)∈M,則表示本次誤差超出了相對于上次誤差的一定波動范圍;若E(k)增大表明誤差增大,需要減小學習率,根據式 (14)可知η(k)將減小,若E(k)減小表明網絡誤差正在減小,需要加大學習率以加快收斂速度,則η(k)增大。由于正態分布函數具有均勻變動性及集中性等特性,且其因子及因變量在因子正方向上負相關,符合學習偏差與學習率的變化規律。根據正態分布一定區域內收斂快的特點,能夠使學習率在誤差較大時快速收斂,根據以上學習率變化規律,本文采用改進的正態分布函數em-E(k)2×η(k-1)調整學習率的變化。


根據文獻 [14,15]可知,最短學習時間權值處于[0.3,0.8]區間,故上式中將λ值調整在0.2到1的范圍。式 (17)中誤差對權值的梯度反映了誤差曲面的曲折程度,如果曲面進入陡峭區域,梯度增大,則式 (17)指數項值減小,降低動量值,能夠抑制誤差的劇烈波動;當曲面進入平坦區域,梯度減小,則式 (17)指數項值值增加,增加動量值,加快網絡收斂。
綜合學習率、動量改進后自適應學習率的反向傳播算法—ALBP算法,算法流程如圖2所示。

圖2 ALBP算法流程
在ALBP算法中,學習率根據誤差E(k)與上次誤差E(k-1)的比較進行自適應增減,若本次誤差值屬于N,表明誤差偏差小,目前學習率有效,只需對動量進行微調;若本次誤差屬于M,表明當前誤差較大或學習率適應當前網絡,故需要進一步調整;此外,當誤差E(k)<ξ×E(k-1)時權值更新是接受的,否則只對學習率進行調整。
實驗所用采集數據工具為Android智能手機,處理數據在服務器端進行,主要配置為:Intel(R)Core(Tn)i3-2100CPU、4GRAM、500G HDD。
方案整體包含3個大部分:出行數據采集、數據預處理、出行模式識別。主要流程如圖3所示。

圖3 出行模式識別主要流程
出行數據采集階段:首先,開發智能手機端數據采集軟件,通過志愿者對出行中的位置及動作參數數據進行采集,數據經網絡上傳到服務器端。數據預處理階段:第一步,去除干擾數據,如:經緯度為0 的點。隨后采用設定的時間片段對GPS和加速度數據進行分割,按照文中第一部分的特征計算方法,統計出行數據特征并對數據進行標準化處理。出行模式識別階段:通過改進的BP神經網絡對處理后的出行數據進行學習,最后對測試數據進行測試識別。
實驗通過開發Android智能手機軟件采集用戶的GPS和加速度傳感器數據。首先,根據Android 系統開源性,通過Android應用程序接口調用手機的GPS和加速度傳感器,對GPS和加速度傳感器進行設置。根據文獻 [4,7]在GPS采集頻率上的研究,本實驗將采集GPS 頻率為1 HZ,加速度采集頻率為10HZ。然后,將采集到的GPS數據采用百度地圖API進行糾偏[16]。使用Android異步處理機制Handler(),監聽的同時異步傳輸數據。本文采用Http協議進行數據傳輸。在服務器端,通過Tomcat運行編寫的Servlet服務程序對智能手機端采集到的參數進行接收、存儲。
實驗數據為實驗室十名志愿者在一個月時間內采集的上下班出行及出差時的交通數據,包含步行、自行車、電動自行車、公交、小汽車5種出行方式。通過安裝自主開發的智能手機數據采集軟件記錄GPS信息和加速度信息,GPS信息類的數據項和加速度信息類的數據項見表1、表2。

表1 GPS信息類的數據項

表2 加速度信息類的數據項
表1中time 為當前時間,latitude,longitude 為采集GPS的經緯度信息,speed為當前速度信息,bearing為當前方位角信息。表2中,x,y,z分別代表當前手機三軸加速度值。實驗采集原始數據統計見表3。

表3 采集原始數據詳情
實驗將每天采集到的數據分類別進行處理,由于采集數據量較大,使用Java語言編程對采集到的原始數據進行統計、分析。實驗首先去除采集到原始數據的干擾數據;隨后,對于不同出行方式數據,分別按照GPS和加速度兩組統計3min內信息,統計方式按照文章第二部分:出行方式特征選擇,進行數據統計;隨后將統計后的數據匯總寫入特征數據庫。訓練數據進入神經網絡之前需要做標準化處理,實驗采用Sigmoid函數作為激勵函數。為了保證神經網絡具有一定的外推能力,實驗將數據壓縮在 [0.2,0.8]區間[12,13],標準化公式為式 (18)

式中:u——標準化后的特征值,ui——同列數據的第i個值,umin——標準化同列數據的最小值,umax——標準化同列數據的最大值。
文獻 [17]將數據分析的時間片段設置為2min,根據文獻 [18,19]國內主要城市平均交通燈時間在90s到120s,同時,為了更充分采集交通數據,實驗將數據分析時間片段長度設計為3min。通過對采集數據的統計,實驗共得到出行特征數據3200,選擇2000 條數據作為訓練數據,其余1200條作為測試數據。
實驗首先測試了ALBP 算法的性能,設置神經網絡采用單隱藏層,隱藏層節點共13 個,訓練次數設置為3000次,選擇測試數據中的200條數據測試學習效果。實驗將四組BP神經網絡進行了對比,其中,第一組數據為普通BP神經網絡訓練后所得結果,第二組為添加了學習率的BP神經網絡訓練后所得結果,第三組為添加了固定的學習率和動量的BP 神經網絡訓練后所得結果,第四組為基于ALBP算法的BP神經網絡。第二組學習率設為0.6,第三組中動量設為0.4、學習率設為0.7,第四組中動量初始值ε設為0.7,ξ設為1.05,m 設為0.9,實驗過程中每隔50次訓練統計一次出錯率,共得到4組,每組60個出錯率數據,結果如圖4所示。

圖4 在指定條件下神經網絡的訓練次數與出錯率曲線
橫軸表示訓練次數,縱軸表示出錯率。由圖可知:未添加學習率的BP神經網絡震蕩較為強烈,學習效果會出現波動性;在第二組訓練中,增加了學習率盡管準確率進一步提高,但是收斂速度依然較慢,在曲線中存在平坦區域,表明學習率無法適應當前的錯誤率變化;第三組中由于動量的加入,結果中未出現較為平直的區域,表明動量能夠使網絡持續收斂跳出平坦區域;基于ALBP算法的BP神經網絡在學習過程中動態調整學習率和動量,對網絡誤差反映更加敏感,收斂速度有了較大提升。實驗對余下的1000條出行數據進行識別,結果見表4。

表4 5種交通模式的識別效果
根據識別結果,步行速度特征和加速度有規律的振動特征較其它方式明顯,在識別的準確率上最高。自行車、電動自行車的速度跨度較大,容易被系統識別為其它方式,如電動車有時速度較快,加速度特征較為平穩,會被識別為小汽車。電動自行車、公交車、小汽車由于其固有的機械特性,在速度、加速度上會出現相似的特征,本文采用速度中值、加速度幅度值以及加速度方差能夠在一定程度上對其進行區別。
根據對識別精度的要求以及采集設備數據流量限制,可以只使用GPS數據或加速度數據對出行模式進行識別。目前,文獻 [20,21]通過GPS數據,利用模糊識別,結合出行速度、距離及出行時間對出行方式進行識別。文獻[22]采用加速度數據,通過統計了加速度的均值、方差、中值、最小值、最大值、四分位數間距及相關系數特征,使用WEKA 提供的決策樹算法對出行特征進行分類識別。文獻 [4]同時使用了GPS 和加速度傳感器數據,通過深度置信網絡對出行方式進行了分類識別。
實驗將本文方案與上述3 種方案進行對比,結果見表5。
文獻 [20]方案基于GPS數據對出行模式進行識別,主要使用已有的出行模式模糊判別方案,根據出行速度、時間、距離判別出行方式。但GPS數據在反映出行方式特征上仍存在不足。如在擁堵條件下,公交車、小汽車的速度特征與其它交通方式相近,識別結果上會產生混淆。同時,對于每種出行方式,其振動特性是獨特的,出行加速度特征能夠較好反映出行方式。文獻[22]方案在使用加速度數據的情況下,分析了出行方式加速度特征。根據不同交通方式在三軸的波動幅度的不同,其識別效果好于基于GPS數據的情況。但以8s作為時間跨度統計數據,對加速度的采集頻率為0-4 Hz,加速度采集頻率較小,不能夠很好捕捉運動細節,在識別效果上弱于本方案。文獻 [4]綜合考慮了GPS參數和加速度參數,使用了加速度均值,但未對三軸加速度進行綜合處理。當手機放置方位不同時,采集數據會出現不一致的情況,即原本x軸的數據會被寫成y軸數據,出現數據的不一致問題,在識別機動車類出行方式時低于本方案提出的方法。本文將三軸加速度進行取模處理,引進加速度變化量的同時,注重了其在實際應用中的效果。在時間復雜度上,文獻 [4]方案中深度置信網絡算法復雜度依賴于訓練集中輸入的個數以及所含隱含單元數的多少;文獻 [20]方案中采用道路匹配及模糊識別算法,區域內道路數量對算法性能影響較大;文獻 [22]方案中決策樹算法由于執行每層時都需要掃描訓練元組集D,元組集合D 的大小對決策樹收斂影響較大;本文算法基于傳統BP神經網絡進行改進,算法復雜度取決于訓練次數m 以及權重數組長度。

表5 不同出行模式識別方案識別效果
本文基于移動互聯網技術,開發了出行數據采集軟件,采集了一定量的出行數據,研究了步行、自行車、電動自行車、公交車、小汽車5種交通模式出行參數特征;采用了改進的BP神經網絡ALBP算法對5種交通模式進行學習和識別,實驗表明改進的ALBP算法加快了BP神經網絡收斂速度,提高了識別效果。出行模式識別結果表明本文方案克服了傳統方法中出行數據采集設備受限、特征參數不明顯、GPS數據糾偏困難的缺陷,能夠取得良好的出行模式識別效果。
[1]Zhang Z,Poslad S.A new post correction algorithm(PoCoA)for improved transportation mode recognition [C]//IEEE International Conference on Systems,Man,and Cybernetics.IEEE,2013:1512-1518.
[2]Reddy S,Mun M,Burke J,et al.Using mobile phones to determine transportation modes[J].ACM Transactions on Sensor Networks,2010,6 (2):13-39.
[3]Xu C,Ji M,Chen W,et al.Identifying travel mode from GPS trajectories through fuzzy pattern recognition [C]//Seventh International Conference on Fuzzy Systems and Knowledge Discovery.IEEE,2010:889-893.
[4]Feng T,Timmermans HJP.Transportation mode recognitionusing GPS and accelerometer data [J].Transportation Research Part C:Emerging Technologies,2013,37:118-130.
[5]Zheng Y,Liu L,Wang L,et al.Learning transportation mode from raw GPS data for geographic applications on the web[C]//Proceedings of the 17th International Conference on World Wide Web.ACM,2008:247-256.
[6]Frendberg M.Determining transportation mode through cellphone sensor fusion [D].Boston:Massachusetts Institute of Technology,2011.
[7]Stenneth L,Wolfson O,Yu PS,et al.Transportation mode detection using mobile phones and GIS information [C]//Proceedings of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.ACM,2011:54-63.
[8]Xu D,Song G,Gao P,et al.Transportation modes identification from mobile phone data using probabilistic models[M]//Advanced Data Mining and Applications.Berlin:Springer Berlin Heidelberg,2011:359-371.
[9]Zheng Y,Chen Y,Li Q,et al.Understanding transportation modes based on GPS data for web applications [J].ACM Transactions on the Web(TWEB),2010,4 (1):1-36.
[10]Hemminki S,Nurmi P,Tarkoma S.Accelerometer-based transportation mode detection on smartphones[C]//Proceedings of the 11th ACM Conference on Embedded Networked Sensor Systems.ACM,2013:13-27.
[11]GE Kenan,CHENG Zhongqing,ZHAO Yunpeng.Prediction of temperature and humidity in underground space based on BP neural network [J].Computer Engineering and Design,2013,34 (6):2190-2194 (in Chinese).[葛珂楠,程忠慶,趙云鵬.基于BP 神經網絡的地下空間溫濕度預測[J].計算機工程與設計,2013,34 (6):2190-2194.]
[12]WEI Jing,PU Xingbo,QIAN Yaofeng,et al.Subgrade settlement prediction of transition section based on momentum back-propagation [J].Journal of Beijing Jiaotong University,2012,36 (1):52-55 (in Chinese). [魏靜,蒲興波,錢耀峰,等.基于動量BP算法的過渡段路基沉降預測 [J].北京交通大學學報:自然科學版,2012,36 (1):52-55.]
[13]GAO Pengyi.Study on the optimization of backpropagation neural network classifier[D].Wuhan:Huazhong University of Science and Technology,2012 (in Chinese).[高鵬毅.BP神經網絡分類器優化技術研究 [D].武漢:華中科技大學,2012.]
[14]LIU Tianshu.The research and application on BP nerual network improvement [D].Harbin:Northeast Agricultural University,2011 (in Chinese).[劉天舒.BP神經網絡的改進研究與應用 [D].哈爾濱:東北農業大學,2011.]
[15]TANG Weicheng.Handwritten English character recognition system [D].Shenyang:Shenyang Ligong University,2009(in Chinese).[唐偉成.手寫英文字符識別系統 [D].沈陽:沈陽理工大學,2009.]
[16]Baidu map data correction [DB/OL].http://api.map.baidu.com/ag/coord/convert?from=0&to=4&x=%f&y=%f,2014(in Chinese).[百度地圖數據信息糾偏[DB/OL].http://api.map.baidu.com/ag/coord/convert?from =0&to=4&x=%f&y=%f,2014.]
[17]Troped PJ,Oliveira MS,Matthews CE,et al.Prediction of activity mode with global positioning system and accelerometer data[J].Medicine and Science in Sports and Exercise,2008,40 (5):972-978.
[18]CHEN Xingyuan.Behind thinking of“cross the road in the Chinese-style”[N/OL].[2012-10-24].http://www.bus-info.cn/index.php?m=content&c=index&a=show&catid=9&id=22153(in Chinese).[陳星院.“中國式過 馬路”的背后思考[N/OL].[2012-10-24].http://www.bus-info.cn/index.php?m=content&c=index&a=show&catid=9&id=22153.]
[19]Guangzhou bus[EB/OL].[2012-11-14].http://jt.gz.bendibao.com/news/20121114/109337.shtml(in Chinese).[廣州公交[EB/OL].[2012-11-14].http://jt.gz.bendibao.com/news/20121114/109337.shtml.]
[20]FENG Chong.Travel pattern recognition based on the user’s mobile location data[D].Kunming:Kunming University of Science and Technology,2011 (in Chinese).[馮沖.基于移動定位數據的用戶出行模式識別 [D].昆明:昆明理工大學,2011.]
[21]ZHANG Bo.Research on trip modal split of OD survey based on the cellular positioning system [D].Beijing:Beijing Jiaotong University,2010 (in Chinese). [張博.基于手機網絡定位的OD調查的出行方式劃分研究 [D].北京:北京交通大學,2010.]
[22]Wang S,Chen C,Ma J.Accelerometer based transportation mode recognition on mobile phones[C]//Asia-Pacific Conference on Wearable Computing Systems.IEEE,2010:44-46.