翟玉婷,賈世杰
(大連交通大學 電氣信息學院,遼寧 大連116028)
由于我國交通擁堵路況愈發嚴重,所以研究交通擁堵路況檢測技術,實現交通路況優化具有重要意義[1]。傳統物理檢測方法如地磁感應[2]、微波[3]、紅外線[4]、超聲波[5]、雷達[6]等存在設備安裝復雜、對道路破壞嚴重、不易維護等弊端。由于圖像具有方便獲取、攜帶信息量大等優勢,并且支持向量機能夠有效預測分析圖像數據,所以本文試圖研究基于數字圖像和支持向量的交通路況檢測方法。
已有的基于機器學習的交通路況檢測方法雖能夠減少大量的數據統計工作,但是這種方法需要利用物理檢測方法獲得車流量信息作為訓練數據,再與機器學習方法相結合從而達到交通路況檢測的目的,所以該方法仍然具有物理檢測方法的缺點。文獻[7]通過對交通路況圖像進行邊緣提取、去噪、邊緣修補以及面積對比等操作,實現交通路況檢測。這種方法盡管利用了圖像方便直觀的優勢,但沒有在惡劣天氣情況下對交通擁堵路況檢測進行測試,不夠實用。
因此,本文克服了普通物理檢測方法的弊端,采用了基于支持向量機 (support vector machines,SVM)的方法對交通路況圖像進行分類,力圖實現不同天氣條件下交通路況檢測。由于塔式邊緣方向梯度直方圖 (pyramid histogram of edge orientation gradients,PHOG)特征能根據圖像形狀對圖像進行詳盡的表述。所以本文提取PHOG全局特征描述圖像,進而用SVM分類器實現交通路況圖像的分類,圖1為分類流程圖。本文重點是通過改變SVM分類器中的核函數及相關參數對4類不同程度的交通路況圖像進行分類,并討論其在各種不同天氣條件下的分類情況,經實驗證明能夠取得較高的分類準確率。

圖1 基于SVM交通路況圖像分類流程
塔式邊緣方向梯度直方圖是在方向梯度直方圖 (histogram of edge orientations gradients,HOG)[8]基礎上發展起來的。主要是將圖像進行四叉樹劃分,得到不同層級數L的圖像,把梯度方向劃分成N個區間;對每一層中所分成連接區域的HOG求和,最終形成圖像的PHOG特征向量。整個圖像PHOG向量的維數為式 (1)[9,10]。假定圖像劃分層級數L=2,這時該層可分為42個連接區域,每個區域作為一個興趣單元,將梯度方向分成N=8個區間,即在每個區域內統計像素點歸一化梯度能得到8維的直方圖;再加上L=0,L=1這兩個層級圖像分出的40+41個區域,最終PHOG特征描述符的維數為式 (2)

PHOG特征的形成主要有以下幾個過程:
(1)提取邊緣輪廓,對邊緣圖像計算梯度模以及角度方向,并進行鄰域標號和角度量化;
(2)將梯度方向劃分為N個區間,并對圖像進行金字塔L層級劃分,形成每個層級的特征向量;
(3)將低層級到高層級的特征向量結合起來,形成維數為式 (1)的向量。
圖2即為待處理原圖像以及進行四叉樹劃分后圖像劃分層級數分別為L=0,L=1以及L=2的邊緣劃分圖。圖3分別為圖2中各個劃分層級數L=0,1,2對應的梯度方向直方圖。由兩圖可知,當層級數L不斷增加時,圖像所得到的特征向量的維數也逐漸增加,對原圖像的表述也更詳盡。

圖2 原圖像與各層級邊緣劃分

圖3 各層級梯度方向直方圖
支持向量機是基于統計學習理論的一種機器學習方法[11,12]。它由Vapnik等人提出,最初是一種二類分類模型,這種線性可分模型旨在找到一個最優超平面能夠將不同類別的實例加以完全區分,且具有最大的區分間隔。由于很多實例在線性空間不易區分,所以,可以通過空間變換,將實例變換到非線性空間,從而實現線性可分。此時關鍵性的問題就是核技巧,通過選擇不同的核函數來達到非線性到線性之間的轉換。
對二分類問題,如圖4所示,試用 “□”代表正實例,用 “△”代表負實例,其目的是求得能將正負實例正確分開的超平面ω·x+k=0,其中ω,k分別為超平面的法向量和截距。圖中能將正負實例正確劃分開的直線不止一條,此時,利用間隔最大化求最優劃分超平面就成為核心問題,并且解ω*·x+k*=0是唯一的。相對應的分類決策函數即為f(x)=sign(ω*·x+k*)。

圖4 二維空間二分類問題
由于大多實例在線性空間不是線性可分的,而將它們經映射變換到非線性空間卻能實現線性可分,如圖5所示,這樣就能簡化在線性空間中求得最優超曲面的計算。這時需要一個映射函數K(x,z)=Φ(x)·Φ(z)實現原空間到新空間的轉換,這個映射函數即為核函數。常見核函數包括線性核函數、多項式核函數、高斯核函數、sigmoid核函數等[12,13]。

圖5 經空間變換的非線性分類問題
本文試圖將PHOG特征描述符與支持向量機相結合在交通路況圖像分類上取得較高的分類準確率,同時采用不同的核函數分別對理想交通路況圖像以及雨、雪、霧惡劣天氣情況下交通路況圖像進行進一步分類比較,提高分類準確率。
實驗在 matlab2008a環境下,主頻2.20GHz,內存2GB,操作系統為windows XP的電腦上完成;所用圖像均為交通監控圖像,分辨率為300*300,分為四類 (非常暢通、暢通、擁堵以及非常擁堵)。表1為實驗所用交通路況示例圖像,每類圖像100幅左右。實驗對圖像提取PHOG特征描述符,然后運用SVM對圖像進行分類,SVM分類器為臺灣大學林智仁所開發的libsvm3.12。實驗每類從圖庫中隨機抽取50幅訓練,10幅測試,分別對四組實驗 (理想訓練理想測試、理想訓練混合測試、混合訓練理想測試、混合訓練混合測試)進行對比,同時采用交叉驗證的方法得到平均準確率。

表1 實驗所用交通路況示例圖像
實驗內容包括:
(1)測試不同層級數L、不同核函數對分類性能的影響;
(2)不同核函數參數對四組實驗準確率的影響;
(3)不同程度惡劣天氣條件下本文與文獻[7]對比實驗。
在改變PHOG特征層級數L實驗中,實驗結果如圖6、圖7所示,圖6中可以看到在L=3時采用兩種核函數得到的平均準確率都達到最高,但是高斯核函數較多項式核準確率更高;在L=3和L=4時采用高斯核函數分類平均準確率均達到90%。此時對比圖7可知,L=4時,分類所用的測試與訓練時間要比其余情況長很多。實驗表明,將圖像劃分的層級數越多,獲取的特征描述符的維數越大,對圖像的表述也就越詳盡,當然提取特征所用的時間也就越長。綜合考慮上述實驗中平均準確率、分類時間以及不同核函數等方面,本文選用高斯核函數,同時選取L=3作為圖像劃分層級數。

圖6 在不同層級數下分別運用高斯核和多項式核得出的平均分類正確率

圖7 不同層級數下分類所用的訓練與測試時間
在確定了圖像劃分層級數后,再對高斯核函數寬度σ加以調整,四組實驗最終得到不同分類平均準確率。為了能夠更直觀地分析高斯核函數寬度對各組實驗的影響,將實驗數據以折線圖形式表示,如圖8所示。在σ2=0.001時,各組實驗平均準確率達到最高,均在92%以上。圖中各組實驗平均準確率均由低變高再變低,這是因為在σ較小時會有更多的訓練樣本被當做支持向量。此時出現過學習現象,泛化能力較差。而從四組實驗可以看出,混合訓練理想測試一組的平均準確率相對其他3組要高,原因是混合訓練圖像中包含了理想情況下的圖像,因此用理想圖像做測試能夠取得相對較好的分類結果;然而對于理想訓練混合測試這組實驗,由于訓練圖像庫中不包含雨雪霧等惡劣天氣條件下的圖像,所以測試時遇到惡劣天氣的圖像容易被誤分為其他類,導致準確率較其他3組略微偏低。

圖8 不同高斯核函數寬度在不同實驗組中平均準確率折線
在以上實驗基礎上,為更好體現每一類圖像的分類效果,在σ2=0.001分類平均準確率最高的情況下,給出四類交通路況圖像分類結果的平均混淆矩陣,如表2所示。由該混淆矩陣可知,非常暢通、暢通以及非常擁堵這3類分類效果理想;但擁堵這一類分類效果相對較差,分類結果容易與非常擁堵混淆。其原因是擁堵情況與非常擁堵情況圖像中車輛數目均較多,從而提取的特征描述符較為相近,導致擁堵與非常擁堵兩類混淆,這也是需要進一步解決的問題。

表2 4類交通路況圖像分類結果的平均混淆矩陣
而對不同程度惡劣天氣情況下 (輕度惡劣、中度惡劣、重度惡劣)交通路況的檢測。分別用文獻[7]的方法與本文所用方法進行對比,圖9為兩種方法平均準確率柱狀圖。數據表明在重度惡劣天氣情況下本文平均準確率比文獻的平均準確率要提高5%。

圖9 本文方法與文獻[7]方法在不同程度惡劣天氣情況下平均準確率
本文為避免傳統物理檢測方法在圖像獲取、設備維護、對路面造成損壞等方面的弊端,采用PHOG特征表述圖像,使用SVM對交通路況圖像進行分類,測試了不同天氣條件下交通路況圖像的分類,提高了惡劣天氣條件下平均分類準確率。當然,仍存在一些需要解決的問題:①本文僅實現了4種擁堵狀態的識別,如何根據圖像內容自動判別更多種擁堵狀態、預測擁堵指數等都有待進一步研究;②特征提取方面,本文選用的PHOG特征雖能對圖像進行表述,但特征提取時間較長,如何減少路況檢測所用時間也是需要解決的問題之一;③分類器方面,本文采用高斯核函數,屬于非線性核,較線性核復雜,如何對分類器核函數進行改進,尋求復雜度低,分類效果顯著的核函數,提高分類準確率等也是需要繼續探討的問題。
[1]FAN Xiaoke.Research on the problem of urban traffic congestion[J].China Public Security (Academy Edition),2007 (1):48-51 (in Chinese).[樊曉珂.城市交通擁堵問題研究[J].中國公共安全 (學術版),2007 (1):48-51.]
[2]RONG Mei,HUANG Huixian,XU Jianmin.Vehicle detection method based on magneto resistive sensors[J].Computer and Communications ISTIC,2011,29 (3):43-46 (in Chinese).[榮梅,黃輝先,徐建閩.基于地磁傳感器的車輛檢測算法[J].交通信息與安全,2011,29 (3):43-46.]
[3]ZHANG Ning,LIN Ming.Design of microwave traffic flow detection system based on new-style signal source[J].Computer Engineering and Design,2012,33 (8):3011-3015 (in Chinese).[張寧,林明.基于新型信號源的微波車流量檢測器設計[J].計算機工程與設計,2012,33 (8):3011-3015.]
[4]Iwasaki Y,Kawata S,Nakamiya T.Robust vehicle detection even in poor visibility conditions using infrared thermal images and its application to road traffic flow monitoring[J].Measurement Science and Technology,2011,22 (8):085501-085510.
[5]Yani Z,Hui G.Development of ultrasonic vehicle detection sensor[J].Computer Measurement and Control,2011,19 (10):2542-2548.
[6]Liu X,Sun Z,He H.On-road vehicle detection fusing radar and vision[C]//IEEE International Conference on Vehicular Electronics and Safety,2011:150-154.
[7]LI Jia,YAN Yusong.Design and iimplementation of dynamic image-based traffic congestion state identification system[J].Computer Engineering and Design,2011,32 (4):1366-1369(in Chinese).[李佳,嚴余松.基于圖像的交通擁堵狀態識別系統 的 實 現[J]. 計 算 機 工 程 與 設 計,2011,32 (4):1366-1369.]
[8]SHU C,Ding X,Fang C.Histogram of the oriented gradient for face recognition[J].Tsinghua Science and Technology,2011,16 (2):216-224.
[9]YUAN Jie,WEI Baogang,WANG Lidong.An image retrieval method synthesizing PHOG shape description and wavelet pyramid energy distribution[J].Acta Electronica Sinica,2011,39(9):2114-2119 (in Chinese).[袁杰,魏寶剛,王李冬.一種綜合PHOG形狀和小波金字塔能量分布特征的圖像檢索方法[J].電子學報,2011,39 (9):2114-2119.]
[10]JIA Shijie,KONG Xiangwei,FU Haiyan,et al.Auto classification of product images based on complementary features and class descriptor[J].Journal of Electronics and Information Technology,2010,32 (10):2294-2300 (in Chinese).[賈世杰,孔祥維,付海燕,等.基于互補特征和類描述的商品圖像自動 分 類[J]. 電 子 與 信 息 學 報,2010,32 (10):2294-2300.]
[11]Deng N,Tian Y,Zhang C.Support vector machines:Optimization based theory,algorithms,and extensions[M].Boca Raton,FL:Chapman and Hall/CRC,2012.
[12]LI Hang.Statistical learning methods[M].Beijing:Tsinghua University Press,2012 (in Chinese).[李航.統計學習方法[M].北京:清華大學出版社,2012.]
[13]Wu X,Kumar V.The top ten algorithms in data mining[M].Boca Raton,FL:Chapman and Hall/CRC,2009.