王鐘銳,李 鵬,陳光武
(1.甘肅省高原交通信息工程及控制重點實驗室;2.蘭州交通大學自動化與電氣工程學院,甘肅蘭州 730070)
近年來,隨著我國鐵路的飛速發展以及各種用于提速與提高運輸效率的新技術的推廣,軌道電路作為檢測列車位置的重要裝置,其自身的運行狀況直接影響著列車運行狀態,因此在保障鐵路運行安全與提高運輸效率過程中起著至關重要的作用[1]。為保證其能夠正常運行,鐵路單位每年對其運行維護投入的成本也越來越多。因此,研究軌道電路的故障診斷與預測技術,實現精確運維與早期故障預警,從而順應鐵總所倡導的從“故障修”轉為“狀態修”的轉變,具有重要的理論意義和實用價值[2]。
現階段在鐵路中應用的軌道電路有多種類型,其中交流軌道電路最為常見,包括50Hz 相敏軌道電路、ZPW-2000A 系列無絕緣軌道電路等,后者在高速鐵路中發揮了重要作用[3]。據國家統計網的數據顯示,截至2021 年末,全國鐵路營業里程達到150 000km,其中高鐵營業里程達到40 000km。鐵路復線率為59.5%,鐵路電化率為73.3%。全國鐵路路網密度達到156.7km/萬km2,ZPW-2000A 系列軌道電路覆蓋率達到95.5%。因此,本文主要對ZPW-2000A 系列的軌道電路故障診斷方法進行綜述。
ZPW-2000A 系列軌道電路故障信號主要表現為集中監測系統中軌道狀態顯示異常以及軌道檢測車采集到的數據異常,其中軌道檢測車采集數據的表現形式有多種,如感應電壓與感應電流、補償電容及載頻信息等。
現階段的軌道檢測車以高速動車組為載體,可編入正常運營圖運行,一方面不影響高速鐵路的正常運行秩序,可提高檢測頻率;另一方面由于車體、速度與實際運營條件接近,獲取的檢測數據能真實反映列車和基礎設施運營時的狀態。軌道檢測車可根據車上感應線圈通過無絕緣軌道電路時產生的電磁感應,得到與該軌道電路相對應的感應電流及感應電壓等信息[4]。
鐵路信號集中監測系統在軌道電路方面的監測內容主要包括發送器故障、接收器故障以及兩端的調諧匹配單元故障等,上述故障均表現為多維形式,包括數字量、模擬量以及對應設備正常與否的開關量[5]。目前主流的以上述故障信息為基礎的無絕緣軌道電路檢測方法技術路線如圖1所示。

Fig.1 Technical route for fault diagnosis of uninsulated track circuits圖1 無絕緣軌道電路故障診斷技術路線
主要分為3類:
第一種技術路線是對集中檢測系統或軌道檢測車傳遞的軌道電路信號進行處理與降噪,然后進行特征提取。再用上述方法對正常狀態下的軌道電路進行特征提取,最后通過對以上兩種特征信息的對比,得到軌道電路的故障信息,進而找到故障點[6]。此種路線大多在軌道電路軌面設備的在線分析中應用較為廣泛,可在合適的條件下快速得出檢測結果,在工程上應用的適用度高,一直是研究熱點。但其局限性在于相比于處理單個故障點,該方法處理多個故障點的能力不是太強,且故障檢測大多適用于軌面設備,如補償電容等。
第二種技術路線將淺層機器學習方法與故障特征提取相結合,進而實現故障分類并診斷[7]。此種方法與第一種純信號處理的方法有一部分重合,同樣是先通過信號處理領域的方法實現降噪、分解、重構,最后進行故障特征提取。但與第一種方法不同的是,其將提取的特征輸入到淺層機器學習方法中實現故障分類,得到故障類型。該方法不再局限于軌面設備,可實現更多類型的故障診斷,但不足之處是該方法比較依賴故障類型庫中故障數據集的大小,在故障類型較少的情況下效果顯著,在故障類型較多的情況下準確率會降低,且其依然依靠第一種技術路線中的故障提取方法[8]。
第三種路線則采用深度學習方法。深度學習是相對于淺層機器學習而言的,其具有比后者更深層的結構,還有較強的非線性特征提取能力,可以直接實現軌道電路信號中的故障特征提取,相比于信號處理方法中特征提取的復雜步驟,深度學習方法更加便捷、高效。相比于淺層機器學習,其可以應對更復雜的故障情況,且保持較高準確率。缺點是深度學習需要大量樣本進行訓練,但由于目前“狀態修”代替“故障修”工作的開展,人工的日常維護使得軌道電路故障情況較少出現,導致故障數據集較少,該情況是深度學習方法的主要局限[9]。
此外還有研究將不同方法相融合對上述路線進行改進,以提高準確率。下面將對各類方法的具體應用進行說明。
軌道電路上的故障大部分來自補償電容的故障,隨著環境的變化會出現容值下降或斷線故障等情況,但是由于補償電容數量太多以及鐵路線路太長等原因,不能每一個故障都進行人工確認,。除補償電容斷線故障外,補償電容容值下降及接觸不良等故障只能由軌道檢測車上的線圈間接感應到。針對這一問題,信號處理方法在鐵路軌道電路故障診斷中得到了廣泛應用,其可對頻譜隨時間的變化特性進行有效分析,對于處理感應電壓與感應電流等較為復雜的信號效果顯著。
經驗模態分解(Empirical Mode Decomposition,EMD)是1998 年由美國科學家Norden 博士提出的一種新型自適應信號時頻處理方法,該方法依據數據自身的時間尺度特征進行信號分解,無須預先設定任何基函數[10]。
基于EMD 的時頻分析方法既適合于線性、平穩信號分析,也適合于非線性、非平穩信號分析,這一點對于軌道電路非線性、非平穩的信息處理比較適用。有一個假設貫穿整個信號處理領域:任何復雜的信號均可視為多個不同的固有模態函數(Intrinsic Mode Function,IMF)疊加的結果,這些固有模態函數相互獨立,且分為線性與非線性兩種情況[11]。根據此假設,設需要分解的信號為x(t),其EMD 分解步驟如下:
(1)生成原始信號的上下包絡線,方法是以給定插值結點處的二階導數值作為未知數求解構造三次樣條函數。在整個信號中,連接極大值點形成上包絡線,極小值點形成下包絡線。
(2)計算每一點中的上下包絡線均值,得到m1(t):

(3)用原始信號x(t)減去包絡線均值m1(t),得到中間信號。

這就是原始信號x(t)篩分后得到新信號的過程C1,1(t)。
(4)由步驟(3)得到的新信號C1,1(t),判斷其是否滿足上述IMF 的條件,如果滿足,該信號就是一個IMF 分量;如果不滿足,則將C1,1(t)看作新的原始信號,重新進行步驟(1)-(4)。直到分解k次后滿足IMF 條件為止。

I1(t)代表原始信號x(t)中最高頻的IMF 分量,IMF 分量的獲取通常需要若干次迭代。
(5)從原始信號x(t)中減去I1(t)得到剩余分量r1(t),隨后將r1(t)看作新的原始信號,重復步驟(1)-(4)得到第二個IMF 分量I2(t),再用r1(t)減去I2(t)后獲得剩余分量r2(t)。如此分解下去,直到無法繼續分解為止,從而完成對信號x(t)的EMD 過程。

(6)剩余的rn(t)為殘余分量,為單調函數,所有IMF分量與殘余分量之和為原始信號x(t):

原始信號x(t)分解后的第一個IMF 包含原始信號的最高頻率,同時也包含最低時間尺度。隨著篩分過程的迭代,IMF 階數增加,對應IMF 包含原始信號的頻率成分降低,時間尺度升高,EMD 分解的收斂條件就是最后的rn(t)為單調函數,且此時rn(t)包含的原始信號頻率最低,時間尺度不小于原始信號的時間尺度,因此可將rn(t)作為趨勢項。
但其不足之處在于容易出現模態混疊與端點效應。模態混疊是指EMD 分解有不完全的情況,即多個不同頻率分量共存于一個IMF 中,會影響后續信號分析。同理,最后的剩余分量可能混在最低一階的IMF 分量里,使得剩余分量作為趨勢項的提取不完全,影響后面的趨勢判斷。端點效應是指原始信號x(t)終究是有限的,在其兩端的信號點用三次樣條法生成上下包絡線時,無法判斷在兩端是否存在極值點以及極值點的性質,所以三次樣條法在此處插值時,不可避免地會出現信號失真的情況。以上兩種情況都會使信號處理結果受到影響,進而導致故障診斷結果的準確率下降[12]。
針對上述EMD 分解的不足,人們提出一種噪聲輔助數據分析方法,即總體經驗模式分解(Ensemble Empirical Mode Decomposition,EEMD)。在EMD 中如果極值點分布不均,會出現模態混疊問題,因此文獻[13]將白噪聲加入待分解信號,利用白噪聲頻譜的均勻分布,當信號加在遍布整個時頻空間且分布一致的白噪聲背景上時,不同時間尺度的信號會自動分布到合適的參考尺度上,并且由于零均值噪聲的特性,經過多次平均后,噪聲將相互抵消,集成均值的結果即可作為最終結果。
但EEMD 也引入了新問題,固有模態函數由于通過求取平均來近似而產生了相應偏差,且其在信號重構過程中殘留了大量冗余噪聲。為此文獻[14]提出互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition Method,CEEMD)方法,CEEMD 方法主要向原始信號中添加兩個相反的白噪聲信號,并分別進行EEMD 分解。CEEMD 不僅解決了EMD 引起的模態混疊問題,而且在保證分解效果與EEMD 相當的情況下,減小了由白噪聲引起的重構誤差。CEEMD 包括以下幾個步驟:
(1)向信號中加入一對幅值相同、相位角相差180°的高斯白噪聲,形成兩個新信號,即:
(2)對信號x1和x2分別進行EMD 分解,將每組分解結果的總體平均記為IMF1和IMF2。
(3)求IMF1和IMF2對應分量的平均值,把該值作為CEEMD 的分解結果,即:

該方法不但克服了EMD 中的模態混疊和能量泄露現象,而且減少了EEMD 方法在信號重構過程中的白噪聲殘留,為軌道電路中的故障診斷提供了新方法。
小波分解可用于突變信號和有孤立奇異點函數的處理,通過小波分解能夠在時域和頻域內表征原始信號的局部特征。但是,小波分解對高頻部分的分辨率低。小波包分解在小波分解的基礎上,對信號的高頻部分作進一步分解,克服了小波分辨率低的缺點,提供了更全面的信號分析。小波包變換建立在小波變換的基礎上,其定義為:

式中的h0(k)、h1(k)相當于長度為2N 的低通和高通濾波器。利用濾波器組實現小波包變換(Wavelet Package Transformation,WPT)的過程類似于小波變換(Wavelet Transform,WT),小波變換是通過一組基函數不停地分解低頻,而對分解出的高頻部分不作任何處理,但是小波包變換除分解低頻外,也分解高頻,得到的頻帶更加精確。
利用小波包可實現非線性信號分析,小波包分析將原始信號分解為多個時頻帶,此時可通過觀察特定頻帶內的時變信號特征對原始信號進行分析。同時,小波包能量中包含大量故障信息,通過對特定頻帶計算其小波包能量并分析,可得到故障特征。文獻[15]證明了小波包分析法在軌道電路故障診斷中取得了較好效果。
變分模態分解(Variational Mode Decomposition,VMD)是Konstantin 等[16]在2014 年提出的完全非遞歸模型,其可以同時提取模態分量。VMD 通過給定的原始信號尋找給定數目k 的一組模態,并確定其各自的中心頻率,使其能夠共同再現原始信號,同時滿足每個模態解調到基帶后都是平滑的。其本質是能夠自適應地在各個波段運用經典的維納濾波器。
相比于上述小波包分析法,當遇到軌道電路電信號中不存在突變信號和有孤立奇異點信號時,可以考慮VMD方法,其對采樣噪聲的魯棒性更強。因為其變分模型優化的方式是采用交替方向乘子法,所以也避免了傳統經驗模態分解方法因循環遞歸分解導致的端點效應和模態混疊問題[17]。VMD 算法流程如下:
(1)采用Hilbert 變換,計算給定函數uk(t),獲取其單側頻譜:

(2)將uk(t)與其對應的中心頻率指數混疊,使其頻譜轉移到相應基帶中。

(3)根據高斯平滑度和梯度平方范數估計信號帶寬。
(4)得到約束變分問題為:

式中,uk={u1,u2,...,uk}為模態函數,ωk={ω1,ω2,...,ωk}為各個模態函數對應的中心頻率。為了將約束變分問題轉變成非約束變分問題,引入拉格朗日算子λ(t)實現精確重構,以及二次懲罰因子α實現重構信號保真。兩者結合后,得到拓展的拉格朗日表達式為:

使用乘法算子交替方向法求解變分問題,迭代優化uk+1、ωk+1、λk+1,求解式(14),其最優解對應的模態分量為:

VMD 方法雖然可根據實際情況確定所給序列的模態分解個數,且在求解過程中可以自適應地匹配每種IMF 的帶寬與最佳中心頻率,還可以很好地實現IMF 的有效分離與其信號頻域的有效劃分,但其模態分量個數即k值與懲罰因子α的選取需要視情況而定,帶有一定的主觀性。換句話說,k與α的選取影響著VMD 分解效果。現在學術上普遍利用鯨魚算法、灰狼優化算法等確定自適應函數,進而對VMD 算法進行改進。改進后的VMD 算法在軌道電路的補償電容故障檢測上取得了較好效果[18]。
以上幾種信號分解方法并不是對軌道電路采集到的原始信號進行處理,而是需要建立相應模型,在模型中抽象出數據量,從而對得到的數據量進行信號分解得到特征值。信號分解方法應用于軌道電路故障診斷中的步驟一般是首先建立ZPW-2000A 軌道電路模型,然后利用模型抽象出可利用以上信號分解方法處理的數據,將其處理后提取故障特征,最后再通過特征分析、故障模式識別等方法達到故障檢測的目的。
要建立軌道電路模型,首先要分析其原理。ZPW-2000A 軌道電路設備根據功能可分為發送端設備、軌面設備與接收端設備。當軌道電路無車占用時,發送端發送移頻信號,移頻信號沿著鋼軌傳輸至接收端,接收端得到信號后控制驅動吸起軌道繼電器或向車站給出軌道空閑的表示,這種狀態又稱為調整態;當軌道電路有車占用時,發送端發送移頻信號,移頻信號在流經列車輪對時,由于輪對的阻抗遠遠小于軌面上補償電容的阻抗,移頻信號則會通過輪對返回發送端,此時只有一小部分到達接收端。移頻信號的數量遠小于接收端驅動繼電器吸起的閾值,所以繼電器此時落下表示有車占用,此時移頻信號列車的輪對分路也被稱為分路狀態。
在ZPW-2000A 軌道電路故障診斷中,由其工作原理可知,根據信號分解所需的原始信號不同,要選取不同的軌道電路狀態,有時甚至要對分路狀態與調整狀態進行對比分析。通過分析軌道電路結構,在其發送端與接收端之間的設備其實都可以用一個等效四端網絡來表示,整體模型即可表示為一個發送器與一個接收器之間級聯一系列的等效四端網絡,其中最常用的就是分路態模型,如圖2所示。

Fig.2 Circuit breaker state model for uninsulated track circuits圖2 無絕緣軌道電路分路狀態模型
ZF為從分路點看去的等效阻抗,RF為列車分路輪對的等效電阻,W(x)為主軌道的等效四端網絡模型,WXX為調諧區的等效四端網絡模型,Wp、Wc分別為匹配變壓器與傳輸電纜等效四端網絡模型。模型得到的數據最終大多表現為軌道電路分路狀態下幅值包絡電流曲線或其歸一化處理后的曲線,首先得到從分路點到發送端的等效四端網絡矩陣F:

根據四端網絡理論,網絡端口的電壓電流滿足以下關系:

因此分路電流為:

最后通過信號分解方法對分路幅值電流信號進行分解處理,提取出故障特征。在軌道電路故障診斷領域常用的故障特征是經過信號分解后的各個頻帶的信號能量。利用信號能量得到各個分量的信號能量特征向量集,通過特征向量集判斷故障點,實現軌道電路故障診斷。
以上信號分解方法主要針對ZPW-2000A 的室外軌道設備,大多用于補償電容的故障診斷,而基于淺層機器學習的診斷方法通過采集到的更多數據集,可以檢測更多故障設備以及判斷出更多故障類型。
對于故障診斷,其理論基礎本質上是數據挖掘,其中特征工程是數據挖掘的一項重要內容。對于軌道電路而言,故障特征的提取尤為重要,提取特征后即進行模式識別,從而實現故障診斷的目的[19]。
基于淺層機器學習的軌道電路診斷方法就是通過輸入的特征信息進行模式識別,而獲得特征信息所需的特征提取步驟則由于淺層機器學習的局限性,需要配合其他方法來完成,進而實現故障診斷。常見的軌道電路故障模類別如表1所示。

Table 1 Common track circuit fault categories表1 常見的軌道電路故障類別
當對檢測到的軌道電路信息數據進行觀測時,這些數據常常擁有較為龐大的數據量以及較為復雜的變量關系,為大樣本數據。大樣本的數據集固然提供了豐富的信息,但是在一定程度上增加了問題的復雜性。
如果分別對每個指標進行分析,往往得到的結論是孤立的,并不能完全利用數據蘊含的信息。但是盲目地減少分析指標,又會損失很多有用信息。所以需要找到一種合適的方法,一方面可減少分析指標,另一方面可盡量減少原信息的損失。
由于不同指標中存在著相關關系,因此可考慮將關系緊密的變量合成一些新變量,使得新變量不相關,從而可以用較少變量來代表存在于各個變量中的數據信息。
以上敘述的就是降維的基本思想,降維有兩種方法,一種是特征選擇,另一種是特征提取。特征選擇是直接消除不重要的特征,選擇重要的信息留下,方法較為簡單,存在一定的不準確性,可能丟失這些特征中的很多信息,常見的方法有頻域分析法[20]。
特征提取則是通過組合現有特征來創建新變量,可以盡量保存特征中存在的信息[21]。但通常選取算法會較為繁瑣,影響運行時間與診斷效率。常見的軌道電路故障檢測領域的特征提取方法有主成分分析法(Principal Component Analysis,PCA)、核主成分分析法(Kernel Principal Component Analysis,KPCA)以及自適應層次聚類分析法等。下面對特征選擇與特征提取的幾種方法分別進行介紹:
(1)頻域分析法。由于ZPW-2000A 軌道電路為無絕緣高頻軌道電路,顯然利用時域分析法不合適。頻域分析是指直接處理通過軌道檢測車獲得的原始頻率信號,主要針對載頻信息與補償電容兩種數據。在軌道電路領域主要利用頻率譜進行分析,而忽略頻率統計特征。因為對頻域信號的平均頻率、均方根頻率、中心頻率和根方差頻率等統計量進行特征選擇,無法取得良好效果。在頻譜分析方面,通過奇異譜、幅值譜、功率譜、倒頻譜、細化譜等頻域方法進行信號分析,可將得到的特征輸入人工智能模型進行故障診斷。
(2)主成分分析法。其是一種多變量統計方法,可將一組存在相關性的數據轉換為線性不相關的數據。其轉換的核心就是正交變換,轉換后的變量被稱為主成分[22],可以使用特征分解或奇異值分解(Singular Value Decomposition,SVD)的方法進行主成分分析。PCA 方法本質上是:現假設有一個n 維的數據集,PCA 通過改變該n 維數據集的基向量,對基向量的坐標軸與坐標原點進行平移,力求使變換后的數據方差最大,即讓數據之間的相關性降到最低。變換后去掉正交軸,得到降維后的數據集。
軌道電路故障檢測中常用奇異值分解進行PCA 降維,假設共有x個樣本,每行是y維的,可看作x×y維的數據樣本X,則根據SVD 方法,該數據集矩陣可分解為:

這里正交陣U的維數是x×y,正交陣V的維數是y×y,Σ是y×y 的對角陣。接下來將Σ分割成r列,記作Σr,利用U和V便能得到降維數據點Yr:

PCA 方法可用來刪除單個特征,也可以減少多個特征。以下有一些策略來幫助判斷到底該減少多少特征:
(1)根據對軌道電路的原理分析選擇一個合適的特征數目,該方法高度依賴于數據集本身的特征以及后續的分析模型,且有一定的主觀性。
(2)通過計算每個成分因子,能夠解釋原始數據變異的百分比,然后將不同成分因子所能解釋的變異百分比相加,即得到了一個值,被稱為累積變異百分比。在PCA 過程中,將選擇能使該值最接近于1的維度個數。
(3)根據上一步驟得到的百分比,進而判斷減去多少特征。
KPCA 本質上是一種新的非線性PCA 方法,該方法的基本思想是:對樣本進行非線性變換,在變換空間進行主成分分析以實現在原空間的非線性主成分分析[23]。其算法步驟如下:
通過核函數計算矩陣K={Kij}n×n,其元素為Kij=k(xi,xj)。其中xi和xj為原空間的樣本,k(·,·)是核函數。
計算K的特征值,并從大到小進行排列,找出由特征值對應的特征向量al,并對al進行歸一化(||al||=1)。原始樣本在第l個非主成分下的坐標為:

其中,xi是指第i個樣本al的維度與樣本數相同。如果選擇m個非線性主成分,即計算K的前m個特征值及相應特征向量,則樣本x在前m個非線性主成分上的坐標構成了樣本在新空間中的表示。
聚類是通過無監督的方式將數據對象以類或簇為單位進行劃分,將具有較高相似度的數據劃分為同一個類,不同類之間的相似度差別較大。
層次聚類算法屬于無監督的分類算法,聚類結果要求類別之間具有良好的可分性,即:類間距離盡量大,類內距離盡量小。由于聚類之前需要人為指定聚類個數或設定相應門限,文獻[24]提出一種自適應層次聚類算法,使其能夠根據自定義判別函數的取值來自適應確定聚類個數,以適用于軌道電路的特征提取。對于具有n個特征的輸入樣本x,綜合考慮類內類間距離對樣本的可分性,定義類內類間距離判據J(x)為:

最后取軌道電路某一點至其前方發送端所有分路點位置處的感應電壓幅值數據的標準差作為特征,構成k×(m+1)維的特征矩陣Φ,表示為:

其中,Φ(i=1,2…k)表示軌道電路中所有感應電壓包絡幅值數據的標準差,反映了所有電容狀態對感應電壓幅值波動的影響;隨后對特征矩陣Φ進行重構,對重構后的矩陣進行自適應層次聚類,以達到故障特征提取的目的。
目前在故障診斷領域,淺層機器學習方法可分為監督學習與非監督學習兩大類,也有介于兩者之間的半監督學習的特殊情況。常用的監督類學習方法主要有人工神經網絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)、相關向量機(Relevance Vector Machine,RVM)等模式識別方法,這些方法各有優缺點,通常與不同的信號處理方法和其他特征提取方法及其對應的優化算法相融合,以實現軌道電路故障診斷,而無法獨自實現特征自提取與識別。
聚類分析法主要應用于非監督學習,聚類與分類相對應,聚類方法不需要樣本的訓練標簽即可對數據根據其特征屬性進行聚合分類,常用的聚類方法有最近鄰分類器等。但聚類方法在數據集較大、維度較高的情況下應用較為困難。文獻[25]建立了基于最小二乘支持向量機的軌道電路故障診斷模型,網絡結構如圖3所示。
在軌道電路的故障診斷中選取輸入最小二乘支持向量機模型中的特征量時,要滿足特征量之間的獨立性要盡可能大,輸入量對輸出量的影響也要盡可能大,且容易被設備檢測出來。基于淺層機器學習進行故障診斷通常用主軌道輸入電壓、小軌道輸入電壓、衰耗盤電壓等數據作為故障診斷特征量。

Fig.3 Fault diagnosis model of track circuit based on least squares support vector machine圖3 基于最小二乘支持向量機的軌道電路故障診斷模型
在基于機器學習軌道電路故障診斷訓練過程中,比較關鍵的一步就是對數據進行預先的歸一化處理,防止不同單位與數量級帶來訓練中的混亂及不準確性。常用的歸一化方法如下:

其中,xi為原始數據,min(x)、max(x)分別為原始數據中的最小值與最大值,y 為歸一化數據。處理后的數據被輸入到最小二乘向量機模型中進行訓練,針對軌道電路的多種故障,采用一對一的方法對k類軌道電路進行故障診斷,對每個類別的樣本和其他類別樣本之間一對一地構建二值分類器,每個二值分類器只用相關的二類訓練樣本進行訓練,一共可構造出k(k-1)/2 個二值分類器。在對測試樣本進行識別時采用“投票法”,將測試樣本輸入給k類中第m類樣本和第n類樣本構造的二值分類器。如果輸出結果判定測試樣本屬于第m類,則給第m類加一票;如果輸出結果判定測試樣本屬于第n類,則給第n類加一票。當所有的k(k-1)/2 個二值分類器對測試樣本分類后,k類中的哪一類得票最多,則判定測試樣本屬于這一類。
選取合適的核函數寬度與調節常數值,得到決策函數,完成該模型的訓練,即得到軌道電路故障診斷的最小二乘向量機模型。
文獻[26]將粒子群算法(Particle Swarm Optimization,PSO)用于支持向量機的參數優化,提出基于粒子群支持向量機的故障診斷模型,并將其運用于軌道電路中,結果優于隨機的參數選取。粒子群算法的主要思想是在可解空間中初始化一群粒子,每個粒子由位置、速度和適用度值確定,適用度值由適用度函數計算得到。粒子在解空間中運動,通過跟蹤個體極值點和群體極值點來更新自己的位置。個體極值是指個體所經歷位置中計算得到的適應度最優位置,群體極值是指種群中所有粒子搜索到的適應度最優位置。粒子不斷地更新位置,每更新一次即重新計算一次適應度值,再通過比較適應度值,更新個體極值和群體極值。
在每一次迭代過程中,粒子通過個體極值與全局極值更新自身的速度和位置,更新公式為:

式中,ω為慣性權重;t為當前迭代次數;vid為粒子速度;c1、c2為非負常數,稱為加速度因子;r1、r2為分布于[0,1]之間的隨機數。
以徑向基函數(Radial Basis Function,RBF)為核函數的支持向量機中有2 個參數:懲罰參數c和核函數參數g。其中,懲罰參數c用于控制超出誤差的樣本懲罰程度,核函數參數g表示徑向基函數RBF 的寬度,c、g對于SVM 的分類準確率有著很大影響。因此,將兩個參數(c,g)構成一個微粒,采用粒子群優化算法尋求較優參數,提高了SVM算法故障診斷的準確率和效率。
以上兩種基于SVM 算法的情況,前者的準確率及參數選取的穩定性不如后者,后者則會面臨陷入局部最優解的問題。為解決粒子群算法陷入局部最優解的問題,文獻[27]提出將模擬退火算法(Simulated Annealing,SA)與粒子群最小二乘支持向量機結合的方法。
SA 算法的思想源于物理中固體物質的退火過程,整個過程與一般的組合優化問題類似,SA 算法能以一定的概率接受惡化解。此概率由其新解與原解對應目標函數的絕對差值、溫度參數T共同決定,T減小則概率減小。概率計算如下:

雖然傳統的SA 算法具有非常好的全局搜索能力、概率突變能力,但仍有一些不足:
(1)在T較大時,迅速收斂至全局最優解,易錯失當前最優解。
(2)過度依賴參數。若T0較大,衰減步長太小,會導致收斂速度過慢,反之,若T0較小則易丟失全局最優解。針對以上不足,利用遺傳(GA)算法的變異思想,在SA 算法中引入簡單變異算子:即引入一個變異概率P,隨機對當前更新后粒子中的一個變量再次初始化。如果P 小于隨機數,則進行自適應變異操作,否則放棄,從而在變異過程中增大種群搜索空間,針對性地改善PSO 算法尋優能力的不足,保證其跳出局部最優解,得到全局最優解,以提高收斂速度和尋優精度。
隨著我國鐵路事業的飛速發展以及軌道檢測車檢測系統和集中檢測系統的高度自動化,針對軌道電路的狀態檢測將產生大量數據,這些數據不僅維度較高且數據量龐大。對于淺層機器學習而言,有兩個方面無法很好地處理。數據集太大會導致其計算時間變長,且淺層機器學習面對高維數據無法很好地實現降維,需要結合其他方法。與淺層機器學習相對的就是深度學習,以深度學習為主的方法恰好彌補了淺層機器學習的缺點,因此在軌道電路故障診斷領域逐步得到應用。
目前,在軌道故障診斷領域應用廣泛的主要有卷積神經網絡(Convolutional Neural Networks,CNN)、深度置信網絡(Deep Belief Network,DBN)、循環神經網絡(Recurrent Neural Network,RNN)等深度學習方法。文獻[28]利用深度置信網絡與海洋捕食者算法優化后的最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)提取故障特征,并取得了較好效果。
深度置信網絡DBN 是一種由多層隱藏受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)堆疊而成的概率生成模型,其典型結構如圖4所示。

Fig.4 Multilayer hidden restricted boltzmann machine probabilistic generative model圖4 多層隱藏受限玻爾茲曼機概率生成模型
RBM 由可見層v和隱藏層h構成,每一層的單元之間都有雙向連接,但每一層中的單元互相獨立。可見層神經元可表示為v={v1,v2,…,vn},隱藏層神經元可表示為h={h1,h2,…,hm},其能量函數為:

其中,wij為可見層單元i與隱藏層單元j的連接權值,ai為可見層單元i的偏移量,bj為隱藏層單元j的偏移量。
DBN 方法對于軌道電路故障特征的提取過程分為預訓練和微調兩個階段。在預訓練階段,將不同類型的軌道電路故障數據輸入到深度置信網絡的第一層RBM 進行無監督訓練,將訓練得到的輸出作為下一層的輸入,以此逐層傳遞貪婪學習,直到輸出層輸出軌道電路故障特征。微調階段是一個有監督學習的過程,將輸出結果與標簽數據進行對比,利用誤差反向傳播算法對DBN 進行逆向訓練,完成參數尋優,進而提取出故障特征。然后采用海洋捕食者(Marine Predators Algorithm,MPA)智能算法對LSSVM 的懲罰因子和核函數參數進行尋優,并建立最優MPA-LSSVM 診斷模型。最后,將DBN 提取的特征樣本導入診斷模型進行軌道電路的故障分類識別。
文獻[29]利用卷積神經網絡創建軌道電路故障診斷模型,將軌道電路診斷主機的實時變化數據作為神經網絡的輸入,將實際使用中常見的故障類型作為輸出,建立輸入與輸出之間的映射關系。在選取深度學習樣本數量的問題上,如果采取單個樣本的方法更新參數,會陷入局部最優,影響神經網絡的性能和泛化能力,因此在處理深度學習樣本數的問題上選用了批處理方法。但使用該方法沒有完全消除上述問題,批處理數目較少會嚴重影響迭代速度,同時極易陷入局部最優;而批處理數目較多會導致無法找到最優參數,批處理數目選擇過于繁瑣。
文獻[30]針對軌道電路調諧區故障,通過CNN 中的卷積層實現軌道電路調諧區特征提取,并對比不同卷積層參數下的診斷準確率及訓練時間,選擇當前條件下相對最優的卷積層參數。同時針對訓練中可能出現的過擬合現象而采用dropout 函數,并通過CNN 中第二全連接層實現故障分類。此外,還考慮到人為構建數據集時數據標簽錯誤的問題,通過構建標簽錯誤數據集的方式,減小錯誤標簽數據對訓練過程的影響,取得了比較全面、良好的效果。
文獻[31]運用深度信念網絡的無監督學習對故障數據進行訓練,得到最優參數值并提取出故障數據高層的分布式特征。選擇BPNN 作為分類器,以無監督學習輸出的參數作為BPNN 初始值,完成反向調優,實現了軌道電路的15 種故障分類。利用數據進行多次驗證,證明了其準確性與有效性。文獻[32]提出一種具有長短期記憶的循環神經網絡,通過對網絡進行訓練實現故障診斷。
以上介紹的基于深度學習的故障診斷方法,相比于傳統的淺層機器學習,其在故障診斷流程方面有著創新性的發展。傳統的淺層機器學習首先進行數據預處理,然后進行特征提取,最后選擇分類器;深度學習方法則是在數據預處理之后直接設計模型,然后直接訓練得出結果。深度學習的特征提取并不依賴于人工,而是由算法自動完成,雖然降低了一些可解釋性,但其在很大程度上解決了如何提取特征以及提取特征的有效性問題。
深度學習方法的學習能力非常強,尤其是在特征工程、故障診斷等應用中表現非常好,只要有足夠的數據驅動,可以將故障診斷的準確率保持在較高水平。此外,其適應范圍也比傳統的機器學習廣泛,里面的神經網絡層數很多、寬度很廣,可以映射到軌道電路的很多函數中,實現綜合故障診斷。
鐵路行業自動化與智能化程度的加快,勢必要在日常生產中產生大量數據。在軌道電路故障診斷中,適合淺層機器學習的特定簡單任務會越來越少,而對于基于深度學習的方法,數據量越大,深度學習的表現越好,非常適用于未來的鐵路故障診斷。
深度學習在軌道電路故障診斷中的大致發展方向是需要更便捷的設備和更加契合的算法模型。現在深度學習所需的硬件設備尚不足以移植到移動端,無法滿足鐵路高效運營與維護的要求,因此未來需要運算能力更強、更加小巧快捷的移動端來支撐深度學習故障診斷模型,以提高運營效率。如今在軌道電路方面利用深度學習方法進行故障診斷通常采用現成的模型,雖然也取得了不錯的準確率,但是沒有針對軌道電路乃至整個鐵路系統的故障診斷算法,故障診斷效果還有很大的提升空間。綜上所述,基于深度學習的方法必定會成為今后鐵路行業故障診斷領域應用的主要方法。
本文總結了現階段以軌道檢測車采集與集中監測系統得到信號為數據集的軌道電路故障診斷方法的3 類技術路線,詳細介紹了3 類技術路線中常用的具體方法,并且在前人基礎上對這些方法發展現狀和本身的局限性進行了梳理。基于信號處理的方法雖然應用的軌道電路故障類型較為單一,大多數只有軌面設備,但由于準確率與實時性較高,應用較為廣泛,依舊是研究熱點;基于淺層機器學習的方法針對較少數據集有著很好的準確率與運算效率,但其特征提取等關鍵步驟的過程有些繁瑣,常需要與其他方法結合;深度學習有著以上兩者的優點,但對數據集大小的要求較高。然而在大數據時代下,這種要求也較容易滿足,因此基于深度學習的軌道電路故障診斷方法將成為今后軌道電路故障診斷的主要思路。