鄭祥愛 劉文波 蔡超 徐夢瑩 王平 姚楠
(1.南京航空航天大學自動化學院,南京 211100;2.高速載運設施的無損檢測監控技術工業和信息化部重點實驗室,南京 211100;3.中國鐵道科學研究院集團有限公司基礎設施檢測研究所,北京 100081)
工程檢測中,有些檢測信號是以距離為自變量的函數而非以時間為自變量,只有在空間域中才能真實地反映被檢對象的特性與狀態,稱為空間域信號[1]。對空間域信號進行等間隔采樣得到空間域等間隔采樣序列。在高速鐵路的軌道質量狀態檢測中,實際軌道分布于空間域,高速綜合檢測列車在檢測過程中非勻速行駛,等時間間隔采樣會導致軌道狀態采樣疏密不同[2],極易造成漏檢,留下安全隱患。因此,軌道檢測系統采用等間距采樣。
軌道質量狀態常用軌道幾何不平順參數表征[3],常見的軌道幾何不平順參數有高低、水平、三角坑、軌距、軌向等。各檢測參數的測量原理可大致分為兩類:激光攝像式和慣性測量式。其中,軌距、軌向由激光攝像式測量原理得到。激光攝像過程容易受到外界不利因素的干擾,例如單側劇烈陽光干擾或鋼軌打磨后過亮導致攝像機無法定位軌距點,均會影響成像過程。激光攝像裝置對獲得的鋼軌圖像進行一系列圖像處理后得到單邊軌距,傳輸到計算機中進行軌距的合成計算[4]。單邊軌距分為單邊軌距左(Gauge Left)和單邊軌距右(Gauge Right),分別用GL和GR表示。GL和GR是決定軌距的關鍵參數,也是研究的主要參數。
軌道檢測系統發生干擾性故障會導致單邊軌距獲得值無效,勢必影響軌距的有效測量而不能正確反映軌道實際質量狀態,從而造成安全隱患。針對這一問題,本文首先選定參考性序列,研究其與單邊軌距之間的相似性,考察該相似性作為故障特征的代表性,以避免故障干擾。
在采用激光攝像組件進行軌距的測量與合成時,以固定的軌道長度距離為采樣間隔獲得了GL和GR的序列值。激光攝像組件集成在高速綜合檢測列車的軌道檢測系統中,該檢測系統同時測量并合成了其他軌道幾何不平順的參數,如曲率、軌向,均為空間域等間隔采樣序列。
曲率的測量主要是通過慣性傳感器陀螺儀、位移計和光電編碼器,不受激光攝像組件間的影響。曲率與GL,GR是相互獨立的關系。軌向的測量包括兩部分:一部分是安裝于軌距檢測梁中央位置的伺服加速度計,即軌向加速度計ALGN,用于測量軌向加速度;另一部分為左右軌距測量裝置,用于測量GL和GR[4]。軌向檢測原理如圖1所示。圖中,x軸為慣性基準;y軸為軌距梁中心位置的橫向慣性位移;D為兩軌標準間距,一般為1500 mm;YL為左軌向;YR為右軌向;M,N為兩軌標準間距中心線上的兩點。

圖1 軌向檢測示意
由圖1 可知,軌距檢測梁中央位置的橫向慣性位移y(x)的大小與曲率存在相關性。當綜合檢測列車經過鐵路彎道(即曲率較大)時,假設列車向左拐彎,軌距檢測梁會由于慣性而整體右移;反之,軌距檢測梁會整體左移。當綜合檢測列車從M點移動到N點,有y(x1)>y(x2),則GL由大變小,GR由小變大。因此,GL,GR的變化趨勢與曲率的變化趨勢類似。根據這一規律,把曲率的測量值作為參考性序列,提取出二者的相似性作為故障特征,可運用到檢測傳感器故障的判別中。
Savizkg-Golag 濾波器(簡稱S-G 濾波器)最初由Savizkg 和Golag 于1964年提出,后被廣泛應用于數據流平滑去噪,是一種基于最小二乘原理的多項式平滑算法。S-G 濾波器的核心思想是用一定長度窗口內多個帶有不同權重的點來表示其中的一個點,實際上是一種移動窗口的加權平均算法,其加權系數通過在滑動窗口內對給定高階多項式進行最小二乘擬合得到[5]。該算法的基本思想為:
設g(n)中的一組數據為g(i),i=-M,…,0,…,M,可以用p階多項式fz來擬合g(i),即

式 中:k為 多 項 式fz的 階 次;ak為 第k階 多 項 式zk的系數。
擬合誤差ε的表達式為

為使平滑前后的數據變化趨勢盡可能不受影響,希望擬合誤差足夠小,則令ε對各系數的導數為零,由此得到

由式(3)可知,只需給定滑動窗口長度M(M為奇數)、多項式階次p以及待擬合的數據g(i),即可確定多項式fz中的各加權系數[6]。
可見,這種數據平滑方式能夠減少對有用信息的影響,保留原始數據的變化形狀與趨勢,且只需要確定兩個參數(滑動窗口長度和多項式擬合階數)。本文將曲率作為參考性序列,計算曲率與平滑處理后的新序列值的線性相關度,根據最佳線性相關度確定滑動窗口長度和多項式擬合階數。
傳統的動態時間規整算法(Dynamic Time Warping,DTW)常用在時間序列的處理中,比如孤立詞的語音識別(識別兩段語音是否表示同一個單詞),是一種時間序列對齊方法,能夠衡量兩個非等長時間序列的相似度[7]。DTW 算法通過規整路徑距離矩陣動態規劃尋找到最小規整路徑距離,以衡量兩個時間序列的相似性。假設有原始時間序列X(序列長度為X)和Y(序列長度為Y),則規整路徑距離的表達式為

式中:D(i,j)為X序列中前i個點與Y序列中前j個點的相似性;d(i,j)為X序列中第i點與Y序列中第j點之間的歐式距離。
最終的規整路徑距離是D(|X|,|Y|)[8],其值越小,兩個原始時間序列的相似性越大。
算法每次執行都會從序列的第一個元素搜索到最后一個元素,時間復雜度為O(n2),數據量較大時算法的實時性較差。采用快速動態時間規整(Fast Dynamic Time Warping,Fast-DTW),時間復雜度降低為O(n)。Fast-DTW 綜合使用限制搜索空間和數據抽象兩種方法來加速DTW 的計算,算法圖解如圖2 所示[9],主要步驟為[8]:
1)粗粒度化。原始數據抽象處理,用多個細粒度數據點的平均值作為粗粒度數據點,從而縮短數據序列長度。同時將搜索空間限制在陰影部分,從而達到減少搜索次數的目的。
2)投影。運用DTW 方法求粗粒度化數據序列的規整距離和規整路徑。

圖2 Fast-DTW 算法
3)細粒度化。將在粗粒度上得到的規整路徑還原到細粒度的數據序列上,最終得到兩個時間序列的相似距離與規整路徑。
試驗數據來源為軌道檢測系統對軌道質量狀態進行檢測監測的測量數據,主要是激光攝像裝置對鋼軌圖像進行處理后獲取的GL,GR,以及慣性傳感器陀螺儀與位移計測量合成的曲率。三者都為空間域等間隔采樣得到的數據序列,采樣間隔為0.25 m。
針對數量龐大的檢測數據,為提高數據處理的速度以及實現較好的相似性度量,采用大滑窗與小滑窗相結合的方法。數據預處理中首先采用大滑窗實現數據的切分,窗長為2 km(8000 點序列值)。利用S-G濾波器平滑數據流時滑動窗口M和多項式階次p的確定結果,分別表示在不同的滑動窗口M與多項式階次p下GL與曲率的線性相關度、GR與曲率的線性相關度,如圖3所示。

圖3 不同M與p下單邊軌距與曲率的線性相關度
根據最佳線性相關度,確定S-G 濾波器的滑動窗口長度M的取值為401 ~601,多項式擬合階次p的取值為2 或3。為保證較高的擬合度,取M=501,p=3。為了消除不同參數之間的幅值差異,且不改變各參數本身的正負符號特性,對數據進行歸一化處理,將等間距采樣得到的各序列值縮放至[-1,1]。歸一化處理后,單邊軌距與曲率的平滑數據流隨里程的變化曲線見圖4。

圖4 單邊軌距與曲率的平滑數據流變化趨勢對比
由圖4可知:
1)平滑后的GL與曲率的變化趨勢高度相似;若將平滑后的GL序列值取為相反數,其變化趨勢也與曲率具備高度的相似性。
2)GL和GR的數據變化特性受曲率的影響,在鐵路軌道非平直或存在拐彎的里程段,GL和GR呈現出一定的波動性,且與曲率的波動性相似或相反。
綜合檢測列車改變行車方向時,則曲率的變化趨勢與GR相似,與GL相反。當GL或GR的變化趨勢與曲率相反時,對其取相反數操作后同樣可以獲得相似性度量。
特別地,由于曲率為零向量時無法參與相似性計算,故須對其進行轉化處理,人為賦值但不改變其直線段特性。按照軌道特性將軌道單元分為直線段與曲線段分別進行處理。本文中軌道處理單元為2 km,曲率全為零的里程段為直線段,否則為曲線段。具體實現流程如圖5 所示。其中,CL為GL與曲率的線性相關度,CR為GR與曲率的線性相關度,DL為GL與曲率的動態時間規整距離,DR為GR與曲率的動態時間規整距離。

圖5 單邊軌距與曲率的相似性度量流程
按上述流程,分別得到不同類型的樣本數據下單邊軌距與曲率的快速動態時間規整距離,結果見表1。

表1 單邊軌距與曲率的快速動態時間規整距離
由表1可知:
1)單邊軌距與曲率的快速動態時間規整距離應在300 ~800。
2)受軌道特性的影響,曲線段軌道中單邊軌距與曲率表現出較好的相似性,直線段軌道中單邊軌距平穩波動在某一穩定值附近,與曲率的相似性稍差,如樣本3 中單邊軌距與曲率的快速動態時間規整距離較大。
3)故障樣本中多表現為單側干擾,例如劇烈陽光干擾,此時單邊軌距與曲率的快速動態時間規整距離大于等于1000;樣本9 和樣本11 表現為雙側干擾,多考慮為受鋼軌打磨干擾,打磨后的鋼軌面過亮導致攝像機無法定位軌距點,此時單邊軌距與曲率便失去了相似性。
綜上,以該相似性程度為故障特征,作為機器學習分類模型的輸入,可為軌道檢測系統的干擾性故障判別奠定良好的數據基礎。
本文將快速動態時間規整(Fast-DTW)方法引入到空間域等間隔采樣序列(軌道質量狀態檢測數據)的相似性研究中,并結合S-G 濾波器平滑數據流對采樣序列進行預處理,根據最佳線性相關度選取了滑動窗口長度M和多項式擬合階次p,得到了單邊軌距與曲率的快速動態時間規整距離。健康數據與故障數據中單邊軌距與曲率的快速動態時間規整距離展現出了較好的區分性。因此,可將該相似性度量指標作為特征運用到故障識別中。但這只能作為檢測傳感器故障判別中的特征之一,要想提高識別精度,還需要其他融合性特征。下一步研究中將考慮提取其他特征與該相似性結合的度量方法,并運用到檢測故障判別中。