周麗軍,周曉旭
(山西省交通科技研發有限公司,山西 太原 030032)
隨著我國公路建設的迅速發展,公路里程持續增長,導致收費站系統迅速擴張。2019年底數據顯示,全國高速收費站約9 400個,省界收費站244組。隨著國家取消省界收費站交通戰略的實施,2019年底基本實現ETC車道全覆蓋,由封閉收費模式向分段自由流收費過渡,2019年底全國收費站ETC車道數約為8.4萬條,門架系統約1.5萬套,估算門架系統ETC車道約4萬條,其中山西省ETC車道數預計約5 900條,其中,收費站ETC車道約3 400條,門架系統約861套,門架系統ETC車道約2 583條[1]。
面對全國路網數量巨大的收費站和門架系統的ETC車道,其ETC性能的優劣直接影響著收費系統的穩定運行,因此,對ETC設計參數、指標、性能等內容進行綜合且全面的測試是保障ETC運行正確性和有效性的關鍵,也是ETC的運營和維護直接的數據來源[2-3]。
為了提高ETC運營和管理的檢測效率和安全性,需要通過先進的技術手段,突破傳統ETC檢測裝備的技術瓶頸,提高質量和效率,形成技術保障體系。山西省交通科技研發有限公司自主研發了一臺面向高速公路運維的ETC性能快速檢測裝備,主要解決傳統ETC車道物理性能檢測儀器設備效率低下、檢測耗時長、檢測過程需要進行封路等突出問題,提升檢測效率,降低檢測時間,減少人員投入,在不停車、不封路、正常車速工況下完成檢測車道系統檢測[4]。
但是,由于在數據采集過程中,受車輛行駛速度、路況導致車輛顛簸等的影響,采集的數據會存在同一地點重復采集、無效與干擾數據增多等問題,使得檢測結果雜亂不清,很難清晰地給予實際物理意義。本文針對以上問題研究了高速公路ETC性能快速檢測數據處理方法,對自主研發的檢測裝備提升檢測水平具有十分重要意義。
檢測裝備以車載式在高速公路行駛,在經過ETC車道時采集數據,其過程中會因等待前車、減速等原因在同一檢測點多次采集數據,產生大量重復采集點數據。這些數據若不處理不僅占據內存,同時在最后能量分布中會占據大量能量值,影響能量正常分布。因此首先需要對采集的原始數據f(x)去除重復數據,即:

式中:g(x)為去除重復數據后的數據集。
圖1為一個ETC車道原始采集數據,共采集了500個數據,但是有部分數據是完全重復的,如圖1中,白色部分為原始采集數據,黑色部分為去除重復點以后的數據,從圖中可以看出,去除重復點后,數據量減少了約36%,在數據庫中極大地減少了存儲空間。

圖1 原始采集點與去除重復采集點比較
采集數據過程中由于受到車載車況以及采樣設備采樣率的影響,使得在一定時間內采集的數據不均勻或者有缺失,那么會因為數據量小導致數據的分布情況不明朗,無法準確表達數據的軌跡趨勢,為了打破數據量小的限制,可以采用插值方法產生合理的數據以支撐數據的分析行為,本文經過幾種插值方法比較,選取三次樣條數據插值方法對數據進行分析。
考慮到本文中需要對某一個ETC車道的ETC性能檢測結果進行趨勢分析,即要從采集數據中提取數據趨勢輪廓信息,因此需要盡可能提取數據的峰值點,再將峰值點擬合成曲線。
在插值之前首先對去除重復數據后的數據g(x)求導數,以獲取數據的極值點:

即在導數函數中大于0的為波峰,小于0的為波谷,分別用Max_g(x)與Min_g(x)表示。
圖2中通過上述方法提取了ETC檢測測量數據信號的波峰與波谷,從圖中可以看出,波峰呈現平穩下降的趨勢,但是有些波谷比波峰的能量值更高,而有些波峰的值甚至達到極低的波谷值(能量-100~-105之間)。因此,若僅僅從能量值大小上對數據進行擬合,會將極低值的波峰(在實際測量中沒有意義)進行擬合。那么需要進一步去除極低的波峰值與較高的波谷值的干擾。
去除以上干擾點可以采取如下思路:遍歷所有波峰波谷,若相鄰的波峰之間的差值小于某一閾值σ0,可刪除此波峰;若相鄰波峰與波谷之間的差值小于某一閾值σ1,可刪除此波谷,即:

根據以上去除干擾后的數據h(x)進行三次樣條插值。三次樣條插值算法流程如下:

圖3中比較了三次樣條插值與線性插值及最近鄰插值的效果,從一正弦信號中提取9個點作為原始數據點,采用線性插值方法能較好地對平滑線段進行擬合,而在彎曲部分只能擬合成直線段;采用最近鄰插值方法基本上只能以直線方式擬合,盡管在弧形部分也只能擬合成直線形式;而采用三次樣條插值方法,能較好地擬合出正弦波形,且在正弦波的曲線頂點處能擬合出平滑的曲線。

圖3 3種插值方法比較
本文采用自主研發的面向高速公路運維的ETC性能快速檢測裝備進行作業,該裝備集成了ETC檢測傳感器、電氣化控制系統、數據采集系統以及數據處理系統,在山西省某一段高速公路收費站ETC車道進行檢測,獲取的一段數據如圖4所示。

圖4 ETC性能快速檢測裝備實測原始數據
從原始數據可以看出,采集的數據存在非均勻性以及數據跳躍間隔較大的特點,使得大多數能量值很低的信號是無效的。從這些原始數據中去除干擾無效信號,獲取信號的軌跡趨勢,如圖5所示。

圖5 原始數據去干擾處理過程圖
首先需要去除冗余點,對數據中找到的相同點賦零值,最后去除零值點,獲得非冗余數據。經計算,此實例中冗余數據占比高達36%,去除這些冗余數據不僅能減少數據計算量,還能針對后續大量的檢測業務極大地減少存儲。再根據本文提出的方法去除干擾點,即對于采集數據中此位置波峰與下一個位置波谷距離較近的數據,以保留波峰去除波谷為原則進行篩除,對于此位置波峰與下一個位置波峰能量差異極大的情況,以去除低能量波峰為原則進行篩除,獲得有效的波峰信號,這些信號經過處理后較好地保留了數據的趨勢,但同時在有些測試點上會缺失有效數據。為了更好地預測跟蹤每個測試點的數據,最后將去除干擾后的數據進行插值處理,通過性能比較,采用曲線平滑效果較好的三次樣條插值方法擬合曲線,如圖6所示,圖6中擬合結果較好地反映了采集數據的輪廓趨勢。

圖6 三次樣條插值擬合結果
本文依托自主研發的面向高速公路運維的ETC性能快速檢測裝備外業中采集的數據,針對環境因素產生的數據干擾等問題,研究了ETC性能快速檢測數據處理方法,分析了數據冗余產生的原因并去除數據冗余,提取數據波峰波谷信息并從波峰波谷中分析出大量無效數據,研究了無效干擾數據的去除方法并采用三次樣條插值方法對有限有效數據進行擬合,形成了有平滑效果的數據輪廓信息,提取了ETC性能檢測數據的軌跡趨勢,表征了ETC信號的能量分布。