朱存仁 盧瑞冰 張超凡
(1.卡斯柯信號有限公司,200071,上海;2.中國鐵路南寧局集團有限公司電務部,530011,南寧 ∥ 工程師)
目前,在城市軌道交通車站站點設置轉轍機動作參考曲線的主要方式是:在已有的道岔動作曲線中,以個人經驗選取一條能夠反映設備正常工作狀態的曲線作為參考曲線。國內研究也嘗試過將檢維修結束前轉轍機設備的最后一條動作功率曲線作為參考曲線進行自動設置[1]。但這些方式的隨機性較大,若設置不當則會影響運維人員對轉轍機狀態的判斷,從而不能有針對性地對轉轍機進行預防性維修。因此,從智能運維的角度出發,應追蹤每一組轉轍機的服役性狀并給予推薦的參考曲線,以此降低運維工作量,同時也可為轉轍機設備的智能運維打好基礎。
在實際工程應用場景內,不同地區、不同型號、不同規格、不同采樣頻率及不同工況下的轉轍機實時監測動作曲線具有較大的差異性[2],因此本文擬采用無監督機器學習的方式來避免過多人工調參步驟引起的“水土不服”問題。所謂無監督機器學習,即不通過人工干預的方式來實現自適應的機器學習過程,相比于有監督的機器學習方法,具有更強的適應性,可以保證應用在使用場景方面的健壯性。轉轍機參考曲線推薦原理如圖1所示。

圖1 轉轍機參考曲線推薦原理
根據實際研究結果得知,在不同工況條件下的轉轍機的動作曲線亦可表現出一些細微差異。實際中,由于滑床板的物理特性差異,如水平、摩擦等,其正向到反向與反向到正向的動作曲線在整體形狀上具有微小可分的區別。鑒于上述背景,針對轉轍機的動作曲線,擬采用具備自適應區分特性的相似度特征來分離不同工作條件下的動作曲線,以作為推薦系統的基礎輸入。本文對較為常用的2種特征降維模型PCA和t-SNE算法進行了試驗比較:t-SNE算法產生的結果優于PCA降維模型,PCA模型的線性方法不利于建模的曲面的流型[3],t-SNE 算法對相似度矩陣降維轉化效果較好。
令C{C1,C2,…,Cm}表示一個轉轍機的所有歷史動作曲線,其中m表示C的樣本數量。為描述方便,若無特別申明,本文中Ci僅表示功率電流曲線。設P為采用泊松采樣提取C中元素作為參考樣本Sp{S1,S2,…,Sk}的概率,k為參考樣本個數,易知:
k=mp
(1)
綜上,根據C與Sp,可以組成如下的所述的對比矩陣Cm,k:

(2)
據式(2)可總結出C的k維相似度矩陣
Dm,k={{d(Cα,Sβ)|β∈[1,k]}|α∈[1,m]}
(3)
當數據量過大時,可能會產生冗余的相似度矩陣維度,造成運算時間激增。為了避免對計算機資源的過度浪費,有效控制運算時間,本系統將控制k變量,即通過式(1)來動態調整p值。
根據上一節可知,k維相似度矩陣Dm,k可以刻畫C的內在元素之間的相對關系 ,由此可以區分單一轉轍機在不同工作狀態下的動作曲線記錄。在實際分析中,由于k的數值過大,使用Dm,k對C的相似度進行分析時,必然遭受維度災難;另一方面,當k數值過大時,人工無法復查,不能直觀地檢驗采用相似度特征進行衡量時其結果的優劣。因此,擬采用特征降維方式來轉換Dm,k為Fm,2,記為C的2維相似度特征,即:
Fm,2=R(Dm,k)
(4)
式(4)中,R(·)表示用過降維算法重構Dm,k以得到Fm,2的過程。t-SNE算法具有最優的降維結果,如圖2所示。

圖2 樣本(19#轉轍機)數據降維結果
圖2中每一個點都表示19#轉轍機的一條歷史動作曲線,通過降維以后的特征值,在二維坐標中顯示出來,即可觀察到其相對的相似性關系??梢钥闯?,19#轉轍機的動作曲線,在曲線形狀上有兩種形態,這兩種形態分別為轉轍機定位到反位扳動與反位到定位扳動兩種工作模式。
本文通過 DBSCAN 算法對相似度特征聚類,根據特征表征的動作曲線形狀聚類成簇。在對大量歷史數據分析中,發現轉轍機的正常動作曲線能夠反映出多種類簇,且每一種工況所反映出來的動作曲線都具備接近的相似性。為了實現上述功能,首先需要自動識別這些類簇,進而令系統在無監督模式下學習到這些分類方法。DBSCAN聚類算法具備較高的聚類準確性,即使在個別轉轍機存在多種工況模式的前提下,也能較合理地聚類成簇[4]。圖3為某轉轍機的復雜工況自適應學習實例,圖中的各個數字代表不同的工況模式。

圖3 轉轍機各工況下數據自適應分類成簇結果
受使用頻度和安裝位置等因素影響,各個轉轍機之間的工況模式可以看作相互獨立的事件。為了下文描述方便,以ti表示任一轉轍機通過無監督機器學習的方式總結得到的工況模式,以圖3轉轍機的動作曲線形狀分布為例,i∈[1,6]。
對于任意處于服役階段的轉轍機,據上文得知存在若干工況{t1,t2,…,ts},對于每組工況ti,都存在對應的動作曲線{C1,ti,C2,ti,…,Cψ,ti},即{Cγ,ti|γ∈[1,ψ]},其中ψ表示該工況下所包含的歷史動作曲線總數。本節主要闡述如何通過{Cγ,ti|γ∈[1,ψ]}生成對應工況下的候選參考曲線Cref,ti。
1) 統計擬合方法。本文嘗試了統計擬合方法和正太擬合方法進行參考曲線的擬合工作。試驗發現:統計擬合方法可以快速地反映出Sti下曲線形狀的主體趨勢,可以通過均值和中位數方式快速擬合出具有普遍規律的候選參考曲線Cref,Sti。以均值擬合為例,其計算方法如下:

(5)
式(5)中,Cγ,ti(α)表示ti下第γ組動作曲線的第α個采樣值;l表示Cref,ti的采樣點數,該數值與對應的轉轍機物理特性有關。
2) 正太擬合方法。統計方法存在一定潛在缺陷,當Sti對應的動作曲線集合中存在游離的動作曲線,即因極個別漏報警所導致的故障數據混入{Cγ,ti|γ∈[1,ψ]}中時,根據式(7)生成的候選曲線會產生一定畸變,需要人工進行調整。
為了避免這種潛在缺陷,可以借助正態分布X~N(μ,σ2)來有效削弱游離動作曲線所帶來的畸變。其中,參數μ為{Cγ,ti|γ∈[1,ψ]}的平均數,參數σ為{Cγ,ti|γ∈[1,ψ]}的標準差。根據常識可知,可游離動作曲線中的數值偏離{Cγ,ti|γ∈[1,ψ]}內的主流數值,因此引入N(μ,σ2)的概率密度函數P:

(6)
式(6)作為式(7)中的加權權重,即可使得生成的候選參考曲線盡可能地接近ti下的動作曲線的樣本核心。
鑒于此,可以通過如下步驟來生成候選參考曲線:

(7)

(8)
Wα,i=P(Cγ,ti(α),μα,σα)
(9)

(10)
結合式(7)-式(10)及式(5),得到正太擬合方法如下:

(11)
與式(5)相比,式(11)具備自適應去噪的特性。圖4為使用正太擬合方法得出的轉轍機動作功率參考曲線。

圖4 正太擬合方法生成的轉轍機動作功率參考曲線
針對城市軌道交通中道岔轉轍機設備類型多樣化、人工設置參考曲線受制于經驗知識、數據分段分析方法不具普適性等問題,本文提出了一種基于轉轍機動作曲線相似度特征的轉轍機工況自適應識別方法和不同工況下轉轍機參考曲線推薦方法。該方法通過分析轉轍機動作曲線相似度,實現了自適應分類成簇,完成了不同工況下的參考曲線推薦,以最小的人力成本為海量繁雜的轉轍機歷史動作曲線數據附加合理的數據標簽,并能根據每個轉轍機的服役性狀給予推薦的參考曲線,解決了目前設置參考曲線受制于人工經驗知識的問題。該識別方法在21萬余條轉轍機動作功率曲線樣本構成的數據集上測試驗證,取得了良好的效果。