李小勇,韋澤賢,楊玉琳
(廣西交科集團有限公司, 廣西 南寧 530007)
由于車輛超限超載現象的普遍存在,對社會、經濟、環境及道路安全都造成嚴重影響。動態稱重技術(Weigh-in-Motion,WIM)在1991年前后[1]被引入我國,作為遏制超限超載的一種手段, 貨運車輛經過收費站時, 要對其進行計重收費。因此, 大量研究人員在動態稱重技術領域進行了許多研究。徐剛等[2]對高速公路稱重系統站場布置進行了研究分析,提出了在服務區、高速入口、出口分別設置靜態稱重系統。為了有效地獲取超載超限條件下公路運輸車輛的實際軸載信息,文獻[3]研究了場稱重的軸載調查及數據分析方法,闡述了車輛輪軸類型分類、車輛軸載稱重調查、按輪軸類型劃分的交通量調查、調查數據分析與軸載譜分析的內容、方法和注意事項。整車式稱重系統精度高,但不能實現連續過車;軸重式稱重系統能夠實現連續過車,但精度較低。針對這些問題,楊德等[4]將2種方式的特點有機結合,提出一種新的整車式不停車稱重系統方案,取得了良好效果。王磊等[5]提出了集高精度動態稱重、監控、收費為一體的EWTC系統整體方案,并成功實施。與此同時,對EWTC方案進行進一步改進與研究,采用新型的 EWTC 系統后收費站點通行能力明顯提高[6],車道通行能力較未使用和使用其他類型動態稱重系統提高5到10倍。文獻[7]研究了交錯式、條帶式、寬板式壓電石英傳感器組合方案及其效果,提出了多條帶、寬板交錯布設方案,很好地解決了車輛走S型、倒車、驟停等情況。文獻[8]提出了一種光纖高速汽車動態稱重系統,可用于對橋上自由運行車輛輪軸重、總重、車輛速度和輪軸間距等參數的采集,為公路橋梁車輛荷載研究提供必要手段。以上提到的方法、裝置、設備等為動態稱重領域提供了多樣化參考,豐富了動態稱重技術的內容,但是,這些方法大都是采用壓電與感應式的輪軸識別方式,并未采用機器視覺技術。
自2020年1月1日我國高速公路實施入口超載治理以來,全國各省市高速公路運營公司對計重設備、車型識別系統等準確性要求更加提高。采用機器視覺的動態稱重系統可進一步增加傳感精度,提高識別速度,增進整個系統的自動化、智能化程度,并對事后稽查等有良好的幫助作用。基于機器視覺的車輪檢測技術其中的關鍵技術,可獲取車輛輪數、軸數、軸距等重要參數, 從而確定車輛類型和準載范圍,為車型識別與動態稱重系統提供判定依據。因此,許多學者在此方面進行了詳細的研究。
在車輪特征提取方面,大部分文獻通過將車輪視為標準圓,進而采用基于Hough變換[9]的圓形檢測算法來實現車輪檢測。例如,王紅亮等[10]利用改進Hough變換算法對預處理后的車輛圖像進行車輪檢測,宓為建等[11]提出了結合激光雷達和Hough變換算法進行車輪檢測。但實際上,車輛在行駛過程中,受胎壓、路面擠壓等不可控因素影響,車輪將會變成非標準圓形,而Hough圓變換特征更適合檢測標準圓形。因此,若僅僅采用Hough圓變換特征,會使得系統的實用性降低,在極端情況下,甚至將會大大降低車輪檢測正確率。針對上述方法存在精度易受環境影響、魯棒性低的問題,本研究通過文獻[12]與對車輪特征的分析,發現車輪具有比較明顯的輪廓特征,而方向梯度直方圖(Histogram of Gradient, HOG)[13]可以很好地去描述車輪輪廓特征,具有對光照、方向、尺度不敏感等優點[14]。
除了車輪特征以外,識別算法也是車輪檢測的重要一環。其中,張瑞等[15]采用基于神經網絡的自適應濾波變步長LMS算法,開發了一套基于神經網絡自適應濾波的車輛超載動態監測系統。陳超波等[16]采用RBF神經網絡作為識別核心,對動態稱重數據處理,驗證了徑向基神經網絡對稱重數據處理表現出良好的精度與速度。支持向量機(Support Vector Machine, SVM)是一類監督學習方法[17],于1964年被提出,在20世紀90年代后得到快速發展,至今已衍生出一系列改進和擴展算法,在人像識別、文本分類等模式識別問題中得到應用,與其他傳統的學習方法(如神經網絡等)相比,具有結構簡單、推廣性能好、學習速度快等優點[18]。另外,通過修正核函數,可以得到各種不同的分類曲面。
本研究提出一種基于HOG特征與SVM識別的車輪檢測方法,用于動態稱重系統的輪軸識別。該方法設計思路為:首先通過高清相機獲得原始圖像信號;其次采用HOG特征描述方法,提取車輛圖像的車輪廓特征向量;最后,采用SVM方法對所提取的特征向量訓練出車輪檢測分類器,最終獲得可對車輛輪軸高效檢測的識別模型。

圖1 HOG特征特提取流程圖Fig.1 Flowchart of HOG feature extraction
(1)顏色空間歸一化。采用Gamma校正法[20]對圖片顏色空間歸一化,目的是為了調節圖像對比度,降低圖像局部陰影與光照變化所造成的影響,同時,歸一化操作還可抑制噪音干擾。
(2)方向與強度分布梯度計算。計算每個像素的梯度(方向分布與強度分布),從而進一步獲取圖像輪廓信息。假設像素點(x,y)的水平方向梯度為gx,垂直方向梯度為gy,像素值為I(x,y),3者關系可表示為:
(1)
像素點(x,y)的梯度幅值g(x,y)和梯度方向θ的關系為:
(2)
(3)構建梯度方向直方圖。將圖像分成若干個單元細胞,通常情況下,采用9bin(即9個維度的特征向量,用圖2中的z1~z9表示)作為直方圖的x軸,角度范圍對應的梯度累加值作為直方圖y軸,如圖2所示。

圖2 梯度方向圖Fig.2 Gradient pattern
(4)重疊塊直方圖歸一化。從梯度計算公式中不難看出,梯度強度對局部光照及前景背景對比度非常敏感,要減少這種影響,必須要對梯度強度做歸一化。歸一化方法多種多樣,但整體思想基本上是一致的:將幾個細胞單元組合成更大的塊。這時整幅圖像就可看成是待檢測窗口,將更大的塊看成是滑動窗口,依次從左到右、從上到下進行滑動,得到一些有重復細胞單元的塊及一些相同細胞單元在不同塊(block)中的梯度信息,再對這些block信息分別作歸一化處理,如圖3所示。

圖3 細胞單元與塊Fig.3 Cells and block
(5)整合重疊塊,并形成最終HOG特征向量。
SVM學習的基本想法是求解能夠正確劃分訓練數據集并且幾何間隔最大的分離超平面。如圖4所示,即為分離超平面,對于線性可分的數據集來說,這樣的超平面有無窮多個(即感知機),但是幾何間隔最大的分離超平面卻是唯一的。

圖4 支持向量與最大間隔Fig.4 Support vector and maximum interval
與其他傳統的學習方法(如神經網絡等)相比,SVM結構簡一單、推廣性能好、學習速度快,此外,通過修正核函數,還可得到各種不同的分類曲面。假設有訓練樣本集表示為:D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈{-1,+1},其中-1表示負類,+1表示正類,則最優分隔超平面可定義為:
他出院時,父親不敢給他錢,卻給他買了一大包德芙巧克力,說:“你小時候就愛吃巧克力,那時候家里沒錢,都買些最便宜的。”后來的一天,他接到繼母的電話,說父親中風了。他一直以為自己恨不得父親死,可看到父親的一瞬,他知道自己真的錯了。父親昏迷不醒,幾天幾夜,他都守在父親的床邊,父親的命終于保住了,卻一直癡傻著,手腳也不會動,就會傻樂。
ωTx+b>0,
(3)
式中,x為訓練樣本向量;ω為法向量;b為位移項向量。訓練樣本向量x與分隔超平面之間的距離r可表示為:
(4)
假設超平面能將樣本正確分類,則對于yi,若yi=+1,則ωTx+b>0;若yi=-1,則ωTx+b<0。令:
(5)
則支持向量獲得的超平面間隔如圖4所示,距離超平面最近的幾個訓練樣本點使得式(5)中的等號成立,即ωTx+b=1,ωTx+b=-1。故距離超平面最近的幾個訓練樣本點稱為支持向量,2個異類支持向量到超平面的距離之和為:
(6)
式(6)中γ值為2個異類支持向量到超平面距離之和,支持向量機的原理就是尋找幾何間隔最大的分離超平面。圖4中,坐標x1與x2表示高維樣本在低維度展開的一個超平面,r為訓練樣本x與超平面間的距離(式(4)),2個異類支持向量到超平面的距離之和為γ。因此,為了滿足式(5)中的約束的參數,并使式(6)中的γ值最大,則可找到具有最大間隔的劃分超平面,即:
(7)
s.t.yi(ωTx+b)≥1,i=1, 2,…,m。
(8)
由式(7)和式(8)可知,想要得到最大間隔,只需最大化‖ω‖-1,等價于最小化‖ω‖2,則可將原優化函數(式(7)與式 (8))表示為:
(9)
s.t.yi(ωTx+b)≥1,i=1, 2,…,m。
(10)
式(9)和式(10)為凸二次規劃問題,此類問題可以使用拉格朗日乘子法將其轉為對偶問題得:
(11)
(12)
式中αi和αj統稱對偶變量或拉格朗日乘子。直觀上,總存在1個拉格朗日乘子,使得沒有限制的拉格朗日算子相對于x的最小值,等于原凸二次規劃問題的最優值。最后可得到最優分類函數:
(13)
在此次試驗中,車輪數據集來自網絡收集,覆蓋了絕大多數車型的車輪。樣本分別為正樣本(對分類起正面作用的,對結果有利的樣本)與負樣本(對分類起負面作用的,對結果有害的樣本)。其中正樣本為216張,負樣本(不帶有車輪的圖片)300張。本研究在訓練時會將所有正負樣本都歸一化尺寸為96×96像素大小的圖片。
將檢測窗口尺寸設置為96×96像素,細胞單元(cell)尺寸為8×8像素,塊(block)尺寸為16×16像素,塊滑動步長為8×8。每個細胞單元的梯度方向量化數量設置為9(即直方圖中bin的數量),這樣就相當于每個細胞單元具有9維特征向量。那么,1副96×96像素樣本圖像中塊的個數為[(96-16)/8+1][(96-16)/8+1]=11×11=121個,每個塊的細胞單元個數為(16/8)×(16/8)=4個,1個細胞單元對應9維特征向量,故1副96×96像素樣本圖像的HOG特征向量維度為121×4×9=4 356 維。
本研究使用OpenCV內置的SVM工具庫,選用C-SVM類型的SVM,核函數為線性核。若令懲罰因子C為無窮大,則SVM退化為硬間隔分類器,此時使用線性核只能處理線性可分樣本(因為對于線性不可分樣本,無法找到1個超平面可以正確劃分所有樣本,于是模型參數不存在可行解)。當C趨于0時,不再關注分類是否正確,只要求間隔越大越好,那么將無法得到有意義的解且算法不會收斂。C的變化如圖5所示。

圖5 不同的C值對分類性能的影響Fig.5 Influence of different C values on classification performance
通過多次測試與驗證試驗,最終設置懲罰因子C=0.01。首先,按照第1小節方式,提取正負樣本的HOG特征。其次,分別對正負樣本打標簽,正樣本標記為1,負樣本標記為0。第三,把正負樣本的HOG特征及樣本標簽輸入SVM中進行訓練。值得說明的是,本研究采用的是梯度下降法進行模型訓練,終止條件設置為經過1 000次迭代,或者分類誤差小于0.01時,SVM的訓練停止。經過訓練迭代并滿足停止條件后,可獲得用于車輪檢測的SVM分類器。
本研究的試驗編譯環境為Visual Studio 2013,采用OpenCV版本為2.4.9。在上一步驟獲得SVM分類器后,對測試圖像采用多尺度滑動窗口的方式進行車輪檢測。本研究提出的車輪檢測方法可以實現對多種車型車輪檢測,且具有精準的車輪檢測效果。試驗表明,本研究算法在復雜情況下,仍可有效應對車輪圖像的局部陰影、光照、角度及尺度變化所帶來的影響,具有魯棒性強、準確性高的特點。為了進一步驗證本研究算法的有效性,將Hough特征與HOG特征進行優劣性對比,在城市道路采集了車輛圖片進行車輪檢測試驗,城市道路部分車輛車輪識別效果如圖6所示。精確統計結果見表1。可以看到,采用Hough特征變換得到的識別結果,正確率僅有80%左右,運用本研究所提的HOG與SVM結合的方法,準確率均在96%以上,滿足實際檢測需求,具有較好的應用價值。

圖6 城市道路車輪識別效果Fig.6 Wheel recognition effect on urban roads

表1 本次試驗檢測結果Tab.1 Test result of this experiment
為了進一步檢驗所提出方法的實用性,將本研究所提的模型部署在高速公路收費站入口的超載治理車道上,并與該車道原本使用的壓電式輪軸識別器進行對比。本次實測采用的是海康威視相機,型號DS-2CD3T,具有180° 的水平視場角,每秒可獲得25張2 560×1 440像素的圖片,詳細的數據對比列在表2中。本研究提出方法很好地檢測出了2軸、3軸、4軸的車輛。但在實際中,某些超長貨車(超出本次試驗所采用的廣角鏡頭范圍)無法檢測出正確輪軸數目。而從表2的統計結果也可以看到,本研究方法的車輛輪軸識別率較原方式提高了5%左右。

表2 實測結果統計Tab.2 Statistics of actual test result
面對日益增加的識別速度、精度等需求,本研究提出了一種采用機器視覺技術的車輛輪軸識別方法,用于動態稱重系統。本研究方法創新性地采用HOG變換特征代替Hough特征,在復雜情況下,仍可有效應對車輪圖像的局部陰影、光照、角度及尺度變化所帶來的影響。其次,采用SVM作為車輪的識別算法,具有結構簡單、模型小巧,推廣性能好、學習速度快等優點,適合大規模快速部署。市政道路試驗與高速公路入口超載車道的實測結果均表明,本研究提出的HOG與SVM結合的方法,可進一步增加傳感精度,提高識別速度,增進整個系統的自動化、智能化程度,并具有良好的實用價值。但本研究在利用SVM時,僅采用了1種核函數(線性核函數),在以后的研究中,可進一步探究不同核函數對檢測結果的影響。