韓子東,崔鵬飛,張 凱
(中國公路工程咨詢集團有限公司,北京 100097)
2019年9月,中共中央、國務院正式印發的《交通強國建設綱要》中特別指出,要“構建泛在先進的交通信息基礎設施”,該項要求給智慧交通的發展指明了方向[1]。在交通強國建設背景下,交通運輸部開展了一系列頂層規劃和戰略部署,將發展智慧交通作為行業主攻方向[2]。其中,在2019年7月,交通運輸部印發了《數字交通發展規劃綱要》,提出讓“啞設施”具備多維監測、智能網聯、精準管控、協同服務能力[3]。高速公路波形護欄就是一種典型的“啞設施”。本研究作者研發團隊設計了一種面向端邊協同的波形護欄監測系統,該系統以波形護欄撞擊監測為主,融合、聯動其他感知設施,一方面能夠提升感知精度,另一方面能夠提高高速公路應急救援和運營養護效率。本研究僅對其中撞擊監測的核心算法進行闡述,傳感器設計、布設的優化和聯動另文描述。
在我國,高速公路交通事故感知基本依賴人工視頻輪詢監控和視頻事件智能檢測兩種方式,雖然我國各高速公路正在進行全國視頻聯網建設工作,但距離高速公路主線視頻全覆蓋還有很長的一段路要走,更何況,受視距、視頻質量、天氣環境等因素的影響,各類攝像機智能檢測的有效距離也十分有限,這會導致高速公路如果僅憑視頻手段,很難實現交通事故的全天候、全線的感知全覆蓋,而利用護欄監測和視頻等其他技術的融合、聯動,是提高交通安全、應急保障效率的解決路線之一。但是,行業內護欄監測還處在探索階段,其技術多采用光纖傳感技術[4]和視頻比對技術[5]。其中光纖傳感技術由于需要在護欄外側通鋪傳感器,發生較嚴重撞擊時其傳感器也會遭到嚴重破壞,其建設成本和維修成本居高不下,阻礙了科技成果的轉化。而視頻比對技術多在運營維護期間,采用車載式攝像機巡邏后,回到數據中心將新、舊視頻進行比對而實現護欄的健康狀態的判斷,無法做到實時監測碰撞事件。此外,對波形護欄撞擊類事件數據的研究也十分稀少,現有研究或產品多采用閾值法來鑒定是否有事故發生。
從研究過程中獲取的數據發現,護欄監測數據中除撞擊產生的數據外,還存在著大量的自然噪聲,這些噪聲的來源可能是來自自然噪聲、傳感器漂移、地磁等因素,導致其從多尺度特性上掩蓋了故障信息[6],此外數據中還包含有對監測碰撞而言是干擾數據,但確是聯動其他設備必不可少的數據,例如有車輛長期占用應急車道。因此,為了能高效識別出碰撞數據,并與其他設備更好實現聯動,必須要從多尺度上降低噪聲、保留干擾信息、分離并定位撞擊產生的數據。采用傳統的閾值法顯然無法滿足上述需求。
本研究將護欄監測的過程視為一種“過程監測”,將碰撞產生的數據、大貨車經過時產生的干擾、環境產生的噪聲數據共同視為“數據故障”,探索利用數據驅動方法來從海量的過程數據中,去除噪聲數據、屏蔽干擾數據,診斷并分離出碰撞數據。由于沒有類似的研究以供參考,需要嘗試多種基于數據驅動的故障診斷方法,從中選擇適合護欄監測的方法,并進行優化。基于數據驅動的故障診斷方法有很多,它是一類方法的總稱[7],這些方法不需要建立被監測對象的復雜的數學模型,只需要利用海量的帶故障標記的過程數據或不帶標記的正常數據來建立投影空間,再利用該投影空間來完成實時數據的故障診斷。數據驅動的故障診斷方法可被分為多元統計類方法、機器學習類方法、信號處理類方法和粗糙集方法等[8]。其中多元統計類方法主要包括主元分析(Principal Component Analysis,PCA)、偏最小二乘法(Partial Least Squares,PLS)和費舍爾判別(Fisher Discrimination Analysis,FDA)等[9]。本研究提出的面向端邊協同的波形護欄監測系統中的各監測模塊,均采用了多種傳感器,當有撞擊事件時,各傳感器數據之間具有多維相關性,該類數據適合采用基于多元統計類方法的故障診斷,其大致原理是先利用海量的正常歷史數據創建多維變量的投射空間,當進行實時監測時,實時數據被投射到該空間內,此時統計各實時數據在該空間的各類統計指標,根據統計指標來進行故障的診斷與分離。
本研究根據上述護欄監測的數據分類,尤其是實地試驗受到的環境噪聲數據的特征,首先利用前期研究的成果,進一步改進了現有的小波閾值降噪算法,對原始數據實現多尺度降噪,重構后可以盡量在抑制噪聲的同時,保留有效信息。將降噪重構后的信號作為故障診斷模型的輸入,再通過對比分析基于PCA,PLS,FDA的故障診斷模型的原理后,認為基于FDA的故障診斷更適合護欄監測數據故障診斷;為提高FDA的抗噪能力,將FDA模型和改進的小波閾值算法結合,形成了基于多尺度費舍爾判別分析(Multi-scale Fisher Discrimination Analysis,MSFDA)的故障診斷模型,該模型作為整套波形護欄監測系統的數據處理核心算法。
本研究最后通過對比試驗,從理論上驗證了基于數據驅動的波形護欄監測模型相比較傳統閾值法準確率更高,同時,也驗證了數據驅動方法中,FDA比PCA,PLS更適合該類情況,原因可能是FDA在初始空間創建過程中需要利用帶有故障數據標記而導致的。此外,本研究最后提出的合成的MSFDA模型為最終應用在護欄監測系統中的算法模型,試驗表明,該模型相比較PCA,PLS,FDA,可顯著提高該系統的抗噪、抗干擾能力,準確率更高。
研發團隊在貨車比例較高的某高速公路外側護欄以200 m間隔,布設了10個監測點,各監測點設置為觸發檢測,即有較大震動時采集一組數據。在數據采集過程中沒有發生撞擊事故,但車流量較大時大型貨車占用應急車道現象較多。從中選取3個監測點,在車流量較大時間段和車流量較小時間段各采集1個小時,所采集的檢測數據,去除無效數據,各約1 350組數據。將兩個時間段數據展開對比如圖1所示。

圖1 高峰期與非高峰期護欄偏離幅值監測數據對比Fig.1 Comparison of monitoring and testing data of guardrail deviation amplitude in peak period and off-peak period
在沒有撞擊事故的前提下,從直觀上看,數據中包含了大量的的噪聲和干擾數據。其中噪聲的原因可能來自大自然的干擾、地磁干擾以及前端傳感器軟硬件工作屬性的不一致等[10]。而且隨著數據量的增多,大量的噪聲在多尺度上掩蓋有用信息[11]。干擾信息的產生原因主要是與重載貨車經過時產生的震動或傳感器的漂移漸變等因素有關,傳感器原因導致的干擾數據往往呈現出緩變型、恒偏差型,而大貨車震動時產生的干擾數據會呈現出高頻型、突變型,這類數據往往會被噪聲掩蓋。
護欄撞擊監測的目標不僅是為了能夠實時檢測出碰撞事件,也要為與其他設備實現聯動提供優質數據來源。例如本研究提到的干擾信息也是有用信息的一種,當干擾信息頻繁出現時,能夠反映出重載車輛數量可能較多,或者現場監測設備出現了故障,需要提醒運營單位重點關注。
綜上分析,本研究首先需要利用數據驅動算法中的小波閾值除噪,在多尺度上降低噪聲,并保留大部分有用信息。其次,選擇適合護欄監測的數據驅動算法,對比各算法的故障診斷準確度。最后合并適合的數據驅動算法,與小波閾值算法合并,形成波形護欄監測的核心算法。
本研究提出的改進的小波閾值除噪方法是在過去的研究基礎上進行改進。由于前期研究成果是針對交通量檢測器而設計的,閾值指標體系較高,本次應用在護欄監測上,需要調低閾值,增強靈敏度。本研究對文獻[11]中的噪聲標準方差估計、閾值設定和小波系數調整函數3個方面進行修改,讓其更適合護欄監測數據的使用情況。
(1) 噪聲標準差估計公式:
噪聲標準差是衡量噪聲與其本來應該正確的信息之間的差距。首先,將原信號進行多尺度的分解,根據經驗,本算法將尺度值J設為5,以此獲得每個尺度下有一個高頻、低頻兩個信號,而高頻信號主要由噪聲構成,需要濾除,設高頻信號為Wj,k,則該高頻信號中的噪聲標準差估計公式定義為:
(1)
式中,j為當前尺度,最高尺度為5;N為當前尺度下的小波系數的總個數;k為當前小波系數的個數。
(2)閾值設定函數
為了去除小波分解后得到的各高頻信息中的噪聲,需要設定一個閾值,這里參考文獻[12]中給出的統一閾值公式,從該公式中可看出,隨著信號的信噪比不同,閾值也在隨著實際情況的改變而改變:
(2)
設定閾值后需要將多尺度分解的J組高頻信號系數按絕對值從小到大進行排列,從而得到一個高頻信號系數向量:P=[Waj, n], 1≤n≤N。以此來獲得每個尺度下的評估向量:R=[rn], 1≤n≤N,其中:
(3)

(4)
其中Pa, j,ρN, j的計算公式如下:
(5)
(3)小波系數估計值的計算方法

因此,得到需要被替換的小波系數的估計值:
(6)
詳細的改進小波閾值除噪算法步驟見文獻[11]。
2.2.1基于PCA的故障診斷模型

當需要區分正常數據和故障數據的時候,通常采用平方預測誤差(Squared prediction error,SPE)和Hotelling’sT2(以下簡稱T2)來檢測過程是否發生異常[14]。

圖2 基于SPE指標的PCA故障檢測示意圖Fig.2 Schematic diagram of PCA fault detection based on SPE indicators


由于SPE與T2指標的監測重點不同,所以會經常出現一個現象:某個在線數據向量在殘差空間的投影在正常范圍內,但是,該數據向量在主元空間的投射卻超過了其控制域范圍。這說明該數據可能是數據故障,也有可能是測量范圍出現了變化,需要用其他手段來輔助決策故障信息。
綜上,當PCA故障診斷模型應用在護欄故障檢測中,可以將10組監測點的每一個傳感器視為一個變量,共同組成一個數據矩陣X。以此來監測數據故障,來判斷是否有傳感器檢測出異常情況。
2.2.2基于PLS的故障診斷模型
但是在護欄監測系統的實際應用中,為了判斷碰撞事件,只需要重點關注某一到兩種傳感器數據,其他種類傳感器的數據僅作為輔助,PLS模型恰巧可以實現該功能。PLS模型是在PCA模型的基礎上,從變量x(t)中,選取重點關注的變量R(t),其方法也基本類似,即利用歷史正常數據構建出Sp與Sr兩個子空間,再將在線監測數據投射到這兩個子空間中,設置統計指標,完成故障檢測。如果變量空間Y中發生故障,即該故障會影響質量變化,則故障一定發生在子空間Sp,如果發生故障不會影響質量變化,則故障一定發生在子空間Sr中。通常,采用T2指標來檢測Sp的故障,用Q指標檢測發生在Sr中的故障[16]。

在上述計算過程中,會發現一個現象,即T2和Q是相關的,這會導致某一個故障可以同時出現在兩個子空間中,這與PCA中采用SPE,T2指標類似,該類現象需要用其他手段來輔助決策故障信息。此外,只有在對被監測系統更了解的前提下,采用PLS的故障診斷模型能夠比PCA更準確、更高效。
2.2.3 基于FDA的故障診斷模型
FDA與PCA和PLS一樣也是一種利用訓練數據構建降維空間,再把在線數據投射到該空間,利用投射的特征參數進行數據的故障診斷。但是,FDA的不同之處在于,它不僅需要正常數據的訓練,還要有標簽的故障工況下的數據參與訓練[18]。如果將護欄撞擊的數據視為一種數據故障,可以人為的創建各種類型的撞擊事件,用采集到的數據,與正常數據一起,對FDA模型進行訓練。
基于FDA的故障診斷模型原理如下[19]:
以前文提到的變量x(t)構成的空間X為正常數據,人為創建的撞擊事件監測數據,按類區分為g(t)構建成的故障事件數據空間G,假設將G并入X,X=[x1x2…xn]T∈Rn×m,一起來訓練FDA模型。定義數據總離散度為:其中,是n個樣本的均值向量。定義Xj為屬于第j類數據的樣本向量集合,第j類數據的類內離散度Sj和總的類內離散度Sw分別為:
(7)
(8)
其中,假設Sw可逆,FDA向量等價于:Sbwi=λiSw·wi。由于Sb的秩小于p,所以最多有p-1個非零的特征根,將計算得到的FDA向量,按列構成投影矩陣Wp∈Rm×(p-1)。因此,樣本xi可被投影到p-1維FDA空間,得到從而對數據實現最優分離。當進行在線監測時,將在線樣本x投影到Wp矩陣的列向量構成的低維空間,得到樣本的FDA得分:結合文獻[20]的馬氏距離等度量方式,找到x所屬故障來源,實現故障診斷。
由于FDA在訓練過程中把故障工況下的數據也一并考慮了,理論上其故障診斷的準確性要優于PCA和PLS,且它以滿足最小化類內離散度、最大化類間離散度為準則的同時,對建模數據進行排列,從而完成故障診斷,避免了PCA和PLS故障診斷指標之間的不確定性。綜上分析,FDA更適合護欄監測系統的故障診斷。
為了滿足實際使用需求,本研究設計了一種基于多尺度費舍爾判別分析(MSFDA)的數據故障診斷模型。經前文的理論分析得知FDA更適合護欄監測系統的故障診斷,但上述分析中均是在假設沒有噪聲的條件下進行的。在實際使用過程中,故障信息和部分干擾信息具有多尺度特性,因此,需要增強FDA的多尺度抗噪能力。本研究提出的基于MSFDA的數據故障診斷模型訓練流程如圖3所示,在離線訓練過程中,使用實測數據,添加模擬撞擊事件產生的數據后,構成樣本數據,用來訓練模型。模型利用小波的多尺度特性,將樣本數據分解后除噪;經信號重構后,再進行FDA建模。

圖3 MSFDA數據故障診斷模型訓練流程示意圖Fig.3 Schematic diagram of training process of MSFDA data fault diagnosis model
在過程監測時,對采集到相同空間大小的數據進行小波分解后,對每一層進行閾值除噪;再將各層信號重構,將過程變量投影至FDA故障空間并排序,利用故障分離圖將干擾信息和碰撞信息分離出來。整體流程見圖4。

圖4 MSFDA數據故障診斷模型工作流程圖Fig.4 Flowchart of MSFDA data fault diagnosis model
為了驗證理論分析結果并對比各類故障診斷模型的準確度,設計仿真試驗,對基于PCA,PLS,FDA,MSFDA的數據故障診斷模型在MATLAB平臺中分別進行仿真試驗。各模型仿真試驗流程如圖5所示。通過訓練數據,在MATLAB中建立各模型的殘差空間和主元空間數據庫,再利用相同的輸入,作為在線數據進行仿真在線故障診斷。根據輸出結果,對比4種模型的準確度。

圖5 試驗流程圖Fig.5 Flowchart of experiment
訓練數據的選擇方式和質量會直接影響到模型的實用性和準確性,因此本研究選擇采用實測數據來訓練模型。試驗準備了2組訓練數據。第1組訓練數據采用前文描述的交通量較小時的實測數據。第2組訓練數據采用模擬撞擊護欄的方法來獲取檢測數據,方法為:選取相鄰的10個監測點,編號從S1~S10,在S2~S5之間的3段護欄,用約10 kg左右的鋼筋,隨機選位置撞擊護欄,記錄全過程的測量數據。測量數據如圖6所示,可看出,模擬撞擊實測數據中除了撞擊數據外,在監測點6~10之間還出現了大量的不規則數據,可能是噪聲,也可能是干擾信息。

圖6 模擬撞擊實測數據展開圖Fig.6 Expansion of measured data of impact simulation
用第1組訓練數據訓練基于PCA,PLS的數據故障診斷模型。用第1,2組訓練數據訓練基于FDA和MSFDA的數據故障診斷模型。
在監測點S1至S2之間的護欄,選擇隨機位置,采用相同方法撞擊護欄,記錄全過程測量數據,作為PCA,PLS,FDA,MSFDA這4個故障診斷模型的輸入。
定義誤報率μf、漏報率μg以及故障算法準確率Φ。其中,誤報率是形容某數據不是故障,但錯報成故障的情況,漏報率形容某數據本應該是故障,卻沒有被檢測到的情況。
計算方法如下:
(9)
式中,n為誤報數據點個數;m為漏報點個數;N為數據總個數。
(10)
3.4.1 PCA故障診斷模型仿真
基于PCA的故障診斷模型需要統計SPE和T2兩個指標來實現故障診斷,各控制限指標結果見圖7。

圖7 基于PCA的故障診斷T2和SPE統計結果Fig.7 Statistical result of T2 and SPE based on PCA
為了定位發生故障的傳感器位置,采用貢獻圖的方法,結果如圖8所示。

圖8 基于PCA的貢獻圖Fig.8 Contribution graph based on PCA
由于大量的噪聲干擾,以及在實際應用過程中,各傳感器之間的線性關系不明顯,導致PCA基本無法實現本次試驗的故障診斷。
3.4.2 PLS故障診斷模型仿真
基于PLS的故障診斷模型需要統計SPE和Q兩個指標來實現故障診斷,各控制限指標結果如圖9所示。

圖9 基于PLS的故障診斷SPE和Q統計結果Fig.9 Statistical result of SPE and Q in fault diagnosis based on PLS
為了定位發生數據故障的傳感器位置,采用貢獻圖的方法,結果如圖10所示。

圖10 基于PLS的貢獻圖Fig.10 Contribution graph based on PLS
與PCA相比,PLS的故障診斷模型的準確率更高,但誤報率也非常高。例如,PLS故障診斷監測到了來自S1,S3的數據故障,但也認為S7和S10也出現了數據故障,其誤報原因可能是噪聲或干擾信息導致。此外,與PCA相同的地方,在實際應用過程中,各傳感器之間的線性關系不明顯,也是導致PLS誤報率過高的原因之一。
3.4.3 FDA故障診斷模型仿真
由于在訓練過程中,將噪聲、故障數據與正常數據一并參與,在線性降維的過程中將噪聲也一并納入故障數據中,因此在FDA故障診斷的結果,如圖11(a)所示,出現了大量的離散噪聲,但由于噪聲與故障信息之間沒有線性關系,因此在利用馬氏偏移量進行故障定位的時候,如圖11(b)所示,準確的定位到S1,S2,S3發生了故障,且故障發生位置可能與S1更接近,這與模擬在線數據的情況基本一致。

圖11 FDA故障診斷樣本得分及故障定位結果Fig.11 Fault diagnosis sample score and fault location result based on FDA
通過以上對比仿真,證實了FDA故障診斷方法,相比較PCA和PLS更適合護欄監測。
3.4.4 MSFDA故障診斷模型仿真
為了從多尺度上降低噪聲對故障診斷的影響,采用MSFDA模型,從仿真結果上,如圖12所示,由于訓練和模擬在線監測的過程中,均采用了改進的小波閾值除噪對數據進行了預處理,因此MSFDA故障診斷中準確的將故障信息分離出來,并相比較FDA,更能精確的定位故障位置。

圖12 MSFDA故障診斷樣本得分及故障定位結果Fig.12 Fault diagnosis sample score and fault location result based on MSFDA
3.4.5 誤差對比結果分析
通過上述對比試驗,從直觀上證實了FDA更適合護欄監測,且MSFDA相比較FDA,故障定位能力更準確。本研究還將通過量化統計,利用各模型的誤報率、漏報率、以及算法準確率,來進行量化對比。結果如表1所示。

表1 故障檢測結果準確率對比
從上表結果中可看出,4種方法的漏報率均保持在較低水平,但影響準確率的主要因素是誤報率。在護欄監測過程中,FDA相比較PCA和PLS,誤報率有大幅降低。而MSFDA比FDA,由于降低了噪聲在多尺度上對故障信息的影響,使得在誤報率和漏報率上均有優化,準確率更高。
為了能讓高速公路波形護欄具備多維監測、協同服務等能力,本研究作者研發團隊研發了一種面向端邊協同的波形護欄監測系統,該系統不僅要實現波形護欄撞擊事件的實時監測,達到及時檢測出撞擊事件的發生,并準確定位其發生的位置、區間的目標,還要具備與視頻等其他設備聯動,實現其他交通感知、管理及運營功能。因此對護欄監測的數據要求是降低噪聲的影響、保留日常震動干擾信息、分離撞擊類信息并實現其定位。而利用傳統的閾值法顯然不能實現該要求,但是基于數據驅動的故障診斷方法只需要利用海量的帶故障標記的過程數據或不帶標記的正常數據來建立投影空間,再將在線數據投影至該空間中,最終利用統計指標來完成實時數據的故障診斷。由于沒有該類研究的參考,本研究通過理論分析和仿真對比試驗,驗證了數據驅動中,基于多元統計類方法中,FDA比PCA和PLS更適合護欄監測。但在試驗過程中也發現了,這3種方法的抗噪能力均不強,因此引入了數據驅動方法中的小波分析法,并在前期的研究基礎上,根據波形護欄原始數據中,噪聲在多尺度上掩蓋了有用數據的特性上,改進了小波閾值算法,將該算法與FDA結合,形成了MSFDA故障診斷模型。最終,試驗結果表明相比較PCA,PLS,FDA,本研究得到的MSFDA算法,可顯著提高該系統的抗噪、抗干擾能力,準確率更高。