劉新宇 黃德啟
(武漢理工大學水路公路交通安全控制與裝備教育部工程研究中心 武漢 430063)
目前路面傳感器是獲取路面濕滑狀況信息主要手段,由于路面傳感器智能獲取斷面路況的點信息,且維護極為不便,基于道路監控攝像機的路況圖像識別技術以及結合路測非接觸傳感器判別路面濕滑狀況成為當前研究的熱點.Kuehnle Andreas[1]利用路面圖像灰度的統計特征作為路面濕滑狀況分類器的輸入,設計了神經網絡路況分類器識別路面干、濕、結冰等狀況.YA MADA MUNEO[2]利用車載攝像機采集路況信息,以路面圖像極化特征等為參數建立路面濕滑狀況評價模型.I.Becchi等[3]通過攝像機拍攝路面水流狀況,綜合圖像分析結果和降雨密度值判斷路面水膜深度,并以此預測路況演變規律.Lars Forsl?f[4]采集3 135幅路面圖像包含了干燥、結冰、積雪和潮濕四種狀況,并提取原始圖像像素灰度統計特征、圖像邊緣和輪廓信息、高亮度像素塊的大小和分布信息作為分類器輸入參數,建立路面濕滑狀況神經網絡分類器.Fu kui[5]通過計算路面圖像的表面亮度和空間頻譜,分析道路的濕滑狀況.王維鋒,初秀民等[6]提出利用D-S證據理論和人工神經網絡方法對不利天氣下的交通運行狀況等級進行識別與預測.
本文首先利用所設計的SV M分類器結合三種訓練算法對道路濕滑圖像進行分類學習訓練,并通過訓練后的SV M分類器對大量道路濕滑圖像進行分類實驗,最后分析了實驗結果,并討論了SV M分類器在道路濕滑圖像分類上存在的優缺點,以期尋找利用有限樣本設計高效、泛化性好的路況圖像識別SV M分類器.
支 持 向 量 機 (support vector machines,SV M)與其他機器學習方法相比,在解決小樣本、非線性及高維模式識別問題上表現出許多特別的優勢,具有良好的推廣能力和很強的普適性,可用于模式識別、回歸估計及函數逼近等方面.支持向量機的最終求解可以轉化為一個線性約束凸二次規劃問題,不存在局部極??;引入核函數方法可以將線性支持向量機簡單地推廣到非線性支持向量機,而且對于高維樣本幾乎不增加額外的計算量,成功地解決了維數災難問題[7].
SV M最初是用以解決兩類分類問題,不能直接用于多類分類.當前已經有許多算法將SV M推廣到多類分類問題,這些算法統稱為“多類支持向 量 機 ”(multi-category support vector machines,M-SV M).它們大致有以下兩種思路[8-9]:(1)通過某種方式構造一系列的兩類分類器并將它們組合在一起來實現多類分類;(2)將多個分類面的參數求解合并到一個最優化問題中,通過求解該最優化問題“一次性”地實現多類分類.
第二類方法盡管看起來簡潔,但在最優化問題求解過程中的變量遠遠多于第一類方法,訓練速度不及第一類方法,而且在分類精度上也不占優.當訓練樣本數非常大時,這一問題更加突出.
支持向量機算法是針對兩類數據分類的,本文推廣SV M的分類思想,對多類數據進行分類.圖1給出了非線性多類分類器的設計思路.

圖1 多類分類的轉化示意圖
由圖1可知,多類分類的非線性模式最終轉化成了兩類分類的線性模式,由此設計非線性多類分類器.圖中非線性向線性的轉換依賴于核函數對輸入空間的非線性變換.具體如圖2和圖3所示.

圖2 核函數的非線性變換

圖3 高維屬性空間的線性分類
經過復雜的變換之后,最終問題優化成求解一個二次規劃問題(quadratic progra mming pr oblem,QP).
本文采取一對一判別策略.對于m類模式的分類問題,可以設計m個兩類分類器,其中每個分類器只區分一類模式與其他類.
給定輸入模式x,設m個分類函數為

在理想情況下,應存在某個k∈{1,2,…,m},使得

且滿足:fJ(x)<0,j=1,…,k-1,k+1,…,m,則輸入模式應屬于第k類.為了增加分類器輸出的可靠性,可以采用更嚴格的判據條件,即如果

式中:τ>0,則判定輸入模式應屬于第k類.
本文采集瀝青路面圖像,選用JVC GZHD6 AC攝像機隨機拍攝.
要實現SVM分類器對道路濕滑圖像進行分類,首先要對道路濕滑圖像進行特征選擇.本文使用基于內容的特征提取方法選擇灰度特征、結構特征和紋理特征.通過離線方式用主成分分析法和Tabu搜索提取有效特征并降維,運用基于類內類間距離的可分性判據選取最有效的低維特征.通過特征庫分析,由灰度方差值,2階Hu不變矩,灰度共生矩陣特征,頻譜密度特征,Gabor紋理特征組成特征矢量構成最優特征解.圖4為特征選擇流程圖.

圖4 特征選擇流程圖
為了對比支持向量機(SVM)在非線性方面的分類性能,運用相關的非線性模式對多類道路濕滑圖像數據分類,該模型包括3種分類算法:OAA算法、OAO算法、BSVM算法.在實現過程中該模型還結合4種核函數:linear內核、rbf徑向基函數內核、poly多項式內核以及Sigmoid內核,形成3×4=12種組合來對多類數據進行分類.
圖5和圖6分別是程序進行分類器設計和實現的流程圖.
在實驗之前,把特征分為二維,研究SV M分類器的分類性能,為多維特征輸入的分類設計作理論基礎準備.設計的分類器界面及結果如圖7所示.

圖5 分類器設計流程圖

圖6 分類器實現流程圖

圖7 SV M分類器界面
表1~表3分別對應訓練時間,支持向量個數和分類錯誤率,以對比3種非線性分類訓練算法的效率與準確率,表4表明了不同樣本情況下的SV M性能對比的情況.

表2 SVM支持向量個數

表3 SVM分類錯誤率

表4 不同樣本情況下的SVM性能對比
從以上實驗中可以分析得出一些結論.從訓練時間上看,BSV M訓練時間最長,要高出其他兩種幾倍.OAA和OAO訓練所需時間大概一致,而核函數對訓練時間的影響不大;從分類所需的支持向量數量上看,BSV M分類所需的支持向量最少,OAO次之,OAA最多,核函數對支持向量個數的影響也不大;從分類的錯誤上看,BSV M錯誤率最小,都為0,這說明該算法能把這個數據集完全正確的分開.OAO分類錯誤率也比較小,OAA的最大.但是在RBF核函數下,其分類錯誤率都為0,說明RBF核函數較其他核函數在某些方面有優勢,而RBF核函數也是常用的核函數之一.選用OAO方法的RBF核函數進行分類試驗,其結果如圖8所示.約定輸出結果分別對應的是干燥、潮濕 、水膜、淤泥、冰雪、松雪、積雪、干冰.從統計中也可以看出:積雪路面的分類正確率達100%,這與其明顯的特征是有很大關系的,最難分辨的是干燥路面,分類錯誤率達83.2%.在訓練樣本為240個時,分類正確率71.8%,而選用360個樣本進行訓練后發現正確率下降到68.0%,選用400個樣本進行訓練后發現正確率下降到66.1%,560個樣本訓練的正確率是65.6%.這一反?,F象也說明了SV M的本質是尋找最優超平面,而不是逼近.

圖8 不同樣本數時的SV M分類結果
1)對于SV M,同一組數據選擇不同的核函數,基本上都可以得到相近的訓練效果.在四種核函數中,選用RBF核函數的SV M正確率稍高一些.OAO和OAA的效率相差不大,但都比BSV M訓練的時間少.尋找合適的核函數,選擇合適的參數是使用SV M進行高效分類的一個重要因素.
2)在訓練過程中,MSE值能反映出分類器實現的正確率,因此,SV M的訓練本身的誤差決定了分類的正確率,可見其泛化性能并不高,訓練個數的增多帶來了特征空間維數的增加,從而導致計算量的增大.
由此可見,支持向量機在二次型尋優過程中要進行大量的矩陣運算,因此,多數情況下,矩陣運算占用了算法時間的主要部分,隨著訓練數據個數的增加,支持向量的個數和訓練時間也隨之增多,而且支持向量只是總訓練樣本中的很少一部分,要使支持向量機標準算法達到最佳效果,應該選取合適的訓練個數,使得分類的訓練時間達到最佳效果,并提高分類的正確率.
[1]Andreas K,Wilco B.Winter road condition recognition using video i mage classification[C]//Source:Transportation Research Record 1627,1998 National Research Council:29-33.
[2]Muneo Y,Koji U,Isao H,Shin Y,Sadayuk T.Detection of wet-road conditions fr o m i mages captured by a vehicle-mounted camera[J].Rob Mechatron,2005,17(3):269-276.
[3]Caporali B E,Castelli F,Lorenzini C.Field analysis of the water fil m dynamics on a road pavement[J].Phys.Chem.Earth(C),200l,26:717-722.
[4]U.S.Depart ment of Transportation Federal Highway Ad ministration.Final report on signal and i mage processing for road condition classification[R].Aerotech Telub and Dalar ma University,2002.
[5]Fukui H,Takagi J,Murata Y,Takeuchi M.An i mage processing method to detect road surface condition usingoptical spatial frequency[J].Intelligent Transportation System.IEEE Conference on,1997.ITSC97:1005-1009.
[6]Wang Weifeng,Wu Qing,Chu Xiumin,Wu Yong.Discussion to infor mation acquisition technology and safety identification method of traffic environ ment[J].Pacific-Asia Wor kshop on Co mputational Intelligence and Industrial Application,2008,12:874-878.
[7]Zhang Xuegong.Introduction to statistical learning Theory and support vector machines[J].Acta Automatica Sinica,2000,26(1):32-42.
[8]Hsu Chih-Wei,Lin Chih-Jen.A co mparison of met hods for multiclass support vector machines[J].IEEE Transactions on Neural Networ ks,2002,13:415-425.
[9]Burges J C.A tutorial on support vector machines for pattern recognition[J].Data Mining and Knowledge Discovery,1998,2(2):l-47.