李婭 歐青立(湖南科技大學信息與電氣工程學院,湖南湘潭 411201)
基于智能手機的交通方式識別的研究
李婭 歐青立
(湖南科技大學信息與電氣工程學院,湖南湘潭 411201)
隨著移動互聯網的普及,各種有關移動互聯網的應用蘊含著巨大的商機,交通方式的自動判別顯而易見在交通規劃領域和LBS(基于位置的服務)領域擁有著廣闊的應用價值。現階段的智能手機擁有越來越強大的功能,通信不再是手機的唯一功能,智能手機的強大在于其不僅擁有通信功能,還有強大的感知、運算和存儲能力,但是在當前有關基于智能手機的交通方式識別研究中,單一的數據來源是難以使交通方式識別算法有很好的適應性的,另外,模式識別算法本身對于不同的場景也有著不同的適應能力,這些對交通方式識別精度的提高是很大的阻礙。
交通方式識別 智能手機 隨機森林算法
隨著移動互聯網的普及,各種有關移動互聯網的應用蘊含著巨大的商機,交通方式的自動判別顯而易見在交通規劃領域和LBS(基于位置的服務)領域擁有著廣闊的應用價值。
1.1交通方式識別概述
模式是客觀事物活動的方式,它包括客觀事物本身,也包括有客觀事物在時間和空間分布的信息。時間萬物都有其獨特性,這種獨特性可用三個方面來理解,即可觀察性、可區分性和相似性。
在AI(人工智能)領域,模式識別已經是一個重要的分支,和人類自身的識別系統相比,計算機的模式識別,其優勢在于計算機擁有極強的計算能力,他可以儲存數量極大的樣本,并通過對這些樣本的分析來提取特征,而完成這些工作,計算機是高效的。如圖1所示為計算機模式識別系統的五個基本組成單元。
如圖1所示,現階段的模式識別系統一般都是由五個基本單元來組成。
(1)數據獲取單元;(2)預處理單元;(3)特征提取和選擇單元;(4)分類器設計單元;(5)決策單元。
1.2定位技術研究

圖1 模式識別系統的五個組成單元

圖2 COO定位基本原理
1.2.1基站定位技術
在各種定位技術中,基站定位技術是最早開始應用的,基站定位目前采用的主要技術是COO(Cell of Origin)技術,COO技術的基本原理是,在移動終端登錄到網絡以后會上報自己的小區ID,移動網絡會據此估算用戶的當前位置,如圖2所示。
1.2.2GPS定位技術
GPS由衛星、地面監控系統和移動終端三個部分組成。衛星提供精密的時間標準并提供定位信息,地面監控系統主要是對衛星工作狀態和運行軌道的監控。
1.2.3A-GPS定位技術
A-GPS定位技術,即輔助GPS定位技術,它是一種對GPS定位方法的改進,A-GPS定位技術仍然無法解決數據缺失和數據漂移問題,但由于有A-GPS服務器的存在,它可以起到很多輔助的作用。
1.3典型識別算法研究
在數據挖掘、機器學習和模式識別等領域中,都需要分類算法,分類算法可以分為三個步驟:(1)對已知類別訓練集進行分析;(2)生成分類規則;(3)通過規則預測新數據的類別。

圖3 陀螺儀有效性驗證

圖4 聲音傳感器有效性驗證
2.1數據采集
按照現階段智能手機的流行配置,本系統要求智能手機含有GPS模塊、加速度傳感器、陀螺儀、聲音傳感器和SIM卡。因為現在一般的智能手機都能夠滿足這個要求,本文就不再贅述手機選型。但是采樣頻率還是需要預先設定:GPS數據每秒采樣1次,加速度傳感器和陀螺儀的采樣頻率為32Hz,聲音傳感器每秒采樣30次。
2.2特征提取
特征量主要包括時域上的特征量,如均值、過均值率、標準差、中位數、最大值與最小值的差、個數等,頻域上的特征量包括和、方差兩類。
(1)與速度相關的特征量;(2)與加速度相關的特征量;(3)與聲音相關的特征量;(4)與交通站點相關的特征量。
2.3基于改進隨機森林算法的模式識別
獲取所有的特征之后,隨機森林算法過程可做如下描述:(1)輸入的數據即樣本集,每個樣本包含有若干個特征屬性和一個類別屬性。(2)訓練樣本集由Bagging方法隨機抽取,最后形成的是由N個樣本組成的訓練樣本集。(3)從樣本的特征屬性中抽取部分屬性作為分裂屬性。(4)以上步驟重復n次,最后形成由n棵決策樹構成的森林,最后再進行匯總排序。
2.4特征量有效性的驗證
特征量有效性的驗證即比較使用和不使用的情況下F值的大小就可以了。
2.4.1陀螺儀
如圖3所示為陀螺儀有效性驗證結果,驗證結果表明,在不使用陀螺儀的情況下, 8種類別的F值均有下降,這也說明,陀螺儀的引入對于交通方式識別起到了一定的作用。
2.4.2聲音傳感器
如圖4所示為聲音傳感器有效性驗證結果,驗證結果表明,相比較陀螺儀,聲音傳感器的引入對于交通方式識別起到的作用更大。
2.5模型簡化
(1)特征重要性排序;(2)模型簡化結果。
模型簡化包含兩個部分,一個是特征集的簡化,那么在特征集簡化之后,就可以進行模型本身的簡化。
交通方式識別最重要的就在于識別的精度以及易實施性,在易實施性方面智能手機擁有先天的優勢,比如利用手機的GPS模塊和加速度傳感器進行交通方式識別的研究論述就有不少,但是識別的精度仍然不夠,正是基于此,本文期望能夠在以下兩個方面對交通方式識別進行更加深入的研究:(1)引入多種數據來源,解決交通方式識別中數據來源單一的問題,并研究在新的數據來源被引入后,對識別準確率的影響。(2)研究不同交通方式識別算法對識別準確率的影響,特別是比較隨機森林算法和支持向量機算法在性能上的異同。
[1]熊文,陳小鴻.城市交通模式比較與啟示[J].城市規劃,2009(3):56-66.
[2]扈中偉,鄧小勇,郭繼孕.基于手機定位數據的居民出行需求特征分析[C].第八屆中國智能交通年會優秀論文集.2013:43-51.
[3]王亮.基于判別模式學習的人體行為識別方法研究[D].黑龍江:哈爾濱哈爾濱工業大學,2011:15.
[4]李輝,張亞超,劉洋等.基于中國移動網絡的實時交通信息采集技術[C].第六屆中國智能交通年會暨第七屆國際節能與新能源汽車創新發展論壇優秀論文集(上冊),2011:121-127.
[5]張治華.基于GPS軌跡的出行信息提取研究[D].上海華東師范大學,2010:22-23.