999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于未來可預知特征的高速列車變流器超溫故障KFF-LSTM預測方法

2023-10-13 00:59:08劉典秦勇楊偉君周偉扈海軍楊寧劉冰趙鵬飛董光磊
中南大學學報(自然科學版) 2023年8期
關鍵詞:特征模型

劉典,秦勇,楊偉君,周偉,扈海軍,楊寧,劉冰,趙鵬飛,董光磊

(1. 北京交通大學 軌道交通控制與安全國家重點實驗室,北京,100044;2. 中國鐵道科學研究院 機車車輛研究所,北京,100081;3. 北京縱橫機電科技有限公司,北京,100094;4. 中南大學 交通運輸工程學院,湖南 長沙,410075;5. 中南大學 軌道交通安全教育部重點實驗室,湖南 長沙,410075)

隨著數據、算力、算法、模型的發展,面向高速列車譜系的故障預測與健康管理(PHM)技術[1]涵蓋了鐵路移動裝備結構化、半結構化、非結構化及流式的海量健康狀態數據。然而,目前高速列車設備狀態異常診斷大部分仍基于傳感器測量閾值組合以事后報警的形式呈現,少部分設備的健康態勢評估也僅在短期預測具有較高置信度。對于高速運營列車來說,提前幾分鐘甚至幾秒收到預警信息,承運單位難以消除設備故障造成的影響。

長時間序列預測(long sequence time-series forecasting,LSTF)是一種以較高預測容量來捕捉輸出與輸入之間長距離依賴關系的預測方法[2-4],已在疾病傳播[5]、經濟金融[6]、能源電力[7-8]、自動駕駛[9]、運量預測[10-11]、狀態識別[12]、故障診斷[13-16]等諸多領域成功應用。JORDAN[17]提出了包含單個自連接節點的循環神經網絡模型(recurrent neural networks,RNN),該方法在短序列任務上的表現效果優異,但關聯長序列反向傳播時過長序列導致梯度消失或爆炸,預測效果較差;CHUNG等[18]在傳統RNN 基礎上提出了門控循環單元結構(gated recurrent unit,GRU),可有效緩解梯度消失或爆炸現象,但仍不能完全解決梯度消失的問題。金曉航等[19]基于轉速、溫度、功率與風速等風力發電特征數據,采用稀疏自編碼神經網絡算法對風電機組異常狀態預警,但如能結合未來可預知氣象數據來強化模型,可取得更好的預測效果;谷歌團隊開發的BERT[20]和OpenAI 團隊開發的GPT-3[21],以復雜網絡結構、海量參數以及強大算力在時序數據預測中取得了成果,在GPT-3 中有1 750億個參數、96層網絡與上百個GPU強大算力支持,但由于鐵路場景的算力成本和時效性約束,沒有足夠的經濟性優勢。

由于預知推演和工程可實踐性的難度,基于未來可預知變量的模型并未廣泛應用。但近年來在交通領域基于未來可預知變量的模型已經有了工程應用的實例。2022 年,北京亦莊開設了自動駕駛示范區,基于交通信號燈信息聯網,某路口某時刻的紅綠燈狀態成為未來可預知的變量信息。導航軟件通過該未來可預知的信息,并結合路況向司機推薦行駛速度,最終可以通過模型計算實現“全程綠燈”。通過大數據、先驗知識及物理定律來預知推演未來某時刻的某變量,可以為既有模型提供更多的可研究方向和應用場景。

高速列車的運營故障診斷面臨預測更準、響應更快等挑戰,本文作者以牽引變流器電機定子的超溫故障為對象,引入靜態、緩變、動態物理量與恒定狀態量等未來可預知特征KFF(known future feature)數據進行訓練。通過調整長短期記憶神經網絡(long short-term memory,LSTM)的輸出門、狀態更新單元及隱變量,降低預測狀態與真實狀態的物理狀態偏差和時間相位偏滯,以優化模型的預測準確度與及時性,并基于高速列車真實運營數據對KFF-LSTM 模型與傳統模型進行了對比和分析。

1 KFF-LSTM故障預測模型

1.1 LSTM神經網絡基本原理

神經網絡預測的準確度與及時性指標定義如圖1所示。

圖1 神經網絡預測的準確度與及時性指標定義Fig. 1 Accuracy and timeliness definition of neural network prediction

LSTM是一種反饋型時間循環神經網絡[22],具有長短期信息記憶能力,作為一種特殊遞歸神經網絡,LSTM 隱藏層增加了記憶單元C與遺忘門F,在時間序列軸時間步t時,記憶單元Ct可以從狀態向量中進行讀取、寫入或刪除的操作;輸入門使記憶單元決定是否更新單元狀態;遺忘門使記憶單元可以丟棄其記憶;輸出門使單元細胞可以決定輸出信息是否可用。LSTM神經元通過輸入門、遺忘門和輸出門的狀態組合和記憶單元操作,實現對長序列數據的預測,其原理如圖2所示。

圖2 LSTM模型原理圖Fig. 2 Schematic diagram of LSTM model

LSTM 模型的輸入參數為Xt、記憶層Ct-1、隱藏層St-1,設有遺忘門Ft、輸入門It、候選記憶單元為C′t、輸出門Ot,輸出參數為當前記憶層Ct、隱藏層St和輸出Yt,其中Yt為St的一個維度,模型可表征為:

式中,σ為Sigmoid 激活函數;⊙為Hadamard 乘積;tanh 為雙曲正切激活函數;wF與bF分別為遺忘門權重矩陣和偏置項;wI與bI分別為輸入門權重矩陣和偏置項;wC與bC為候選記憶門權重矩陣和偏置項;wX和wH分別為輸出門輸入矩陣X和隱狀態矩陣H的權重矩陣;bO為輸出門的偏置項。

1.2 KFF-LSTM故障預測模型構建

通過在LSTM 神經網絡加入未來可預知特征KFF(known future feature)進行訓練與優化,形成KFF-LSTM 故障預測模型。模型中引入的未來特征包括不可預知特征數據X(u)和可預知特征數據X(p),對于高速列車時序數據集,其特征狀態包括動態物理量、緩變/靜態物理量和恒定狀態量。

1) 動態物理量是隨列車運營工況而實時動態變化的狀態特征量。對于部分不可預知的動態物理量,基于固定線路、固定操作指令、里程、時速等信息,以時序平移、前后狀態繼承、大數據預測等方式可轉換為未來可預知的特征值。例如根據列車運行圖、運行速度與里程點位置,列車經過給定線路某位置的時刻是可預知的,結合天氣預報可預知該時刻、該位置通過列車的室外溫度;結合購票檢票信息通過旅客及其行李的平均質量可以推算出某區段的列車載運總質量;由于給定線路固定里程位置時接觸網壓比較穩定,結合線路運行圖以及前車通過某里程點的接觸網壓有效值預知列車到達該里程點的接觸網壓。

2) 緩變/靜態物理量是某行駛區間僅發生緩慢變化或保持不變的列車運行物理特征量。對于固定線路同一車型的某車次列車,其緩變/靜態物理量是恒定的,如轉向架空氣彈簧壓力。

3) 恒定狀態量是某行駛區間保持恒定的列車運行狀態特征量,如軟件版本等。

對高速列車牽引變流器的電機定子溫度故障相關特征數據集,其物理量特征類型、特征描述、數據來源與是否可預知列表如表1所示。

表1 高速列車牽引變流器電機定子溫度物理特征數據集Table 1 Physical features of high-speed train traction converter motor stator temperature

KFF-LSTM 模型算法步驟分為特征選取、預知推演、數據歸一化、特征權重分配、模型訓練與特征預測。引入歷史已知特征與未來可知特征數據的KFF-LSTM模型原理圖如圖3所示。在特征選取階段,產品專家按照數據性質將數據分為定類數據、定序數據、定距數據、定比數據,通過行業經驗及先驗知識進行特征值選取;在預知推演階段,基于全路列車大數據、物理定律、產品特性,推演動態物理量、緩變/靜態物理量在未來時刻的特征值;在數據歸一化階段,通過0均值歸一化方法避免數值大的特征對模型訓練產生負面效果;在特征權重分配階段,依據模型預訓練結果調整特征權重參數以獲得更優的預測效果;在KFF-LSTM 模型訓練與特征預測階段,通過引入未來可預知特征數據,提高模型預測準確性、降低時序偏置(滯后)步數。

圖3 KFF-LSTM模型原理圖Fig. 3 Schematic diagram of KFF-LSTM model

在KFF-LSTM 預測模型中,為生成預測值Yt和下一個時間片的完整輸入,需計算隱藏節點的輸出St。當計算未來不可預知特征X(u)(Xt∈X(u))時,沿用原模型表達式;當計算未來可預知特征X(p)(Xt∈X(p))時,由于下一時刻的特征值是已知的,故不需要記憶單元Ct和隱藏狀態單元St參與運算,輸出Yt的計算公式如下:

在歷史區間可預知特征Xt(p)和不可預知特征Xt(u)皆為模型輸入,在預測區間可預知特征Xt(p)仍作為模型輸入并參與權重矩陣和偏置項計算。

2 牽引變流器電機定子溫度預測

2.1 數據集描述與預處理

牽引變流器作為高速列車電能轉換的關鍵部件,在列車運行過程中會產生大幅熱量,而服役過程中冷卻系統濾網堵塞會導致變流器過熱,超溫嚴重時引發燒損等故障,影響列車正常運營。針對高速列車牽引變流器電機定子的超溫故障,對某型21 列車的239 個特征采樣點收集了10.4 萬個數據樣本,數據集樣本包括線路號、車次號、所在車廂與功能位置等靜態物理量,閾值超限標簽、操作狀態等緩變物理量,日期時刻、里程信息、運行車速、定子溫度、冷卻液溫度、室外環境溫度、電機轉速/功率/電流/電壓等動態物理量。

由于不同車型的設備與技術條件差異,其物理特征的關聯影響有所差別;不同線路的列車運行圖與里程地理信息完全不同,無法從不同線路中獲取有效未來可預知信息,因此,對于不同車型、不同線路的列車運行數據集采用獨立的模型參數進行訓練及預測。對于多源異構數據集的預處理如下。

1) 統頻處理。由于各類傳感器采樣頻率不統一,將所有特征狀態數據統頻為1/60 Hz(采樣間隔1 min),針對超統頻的狀態數據采用極值重抽樣降頻,針對低統頻的狀態數據采用線性插值升頻。

2) 數據清洗。對于整備狀態列車無運行速度的數據樣本,由于數據價值密度低,不是溫度故障預測模型關注的狀態數據,進行直接刪除。

3) 數據填充。由于運營現場工況較為復雜,在數據采集、傳輸和轉儲過程中有部分數據缺失,缺失數據用時域最近的上一個樣本數據填充。

4) 歸一化。牽引變流器電機定子溫度相關特征包括溫度、電壓、電流、壓強、質量、長度等物理量,為避免不同物理量單位換算對模型訓練的影響,采用0均值歸一化對訓練驗證數據集進行預處理使各特征均值為0、方差為1。

式中:Z為歸一化后的特征值;x和xˉ分別為當前樣本特征值與數據集樣本平均值;N為數據集樣本數量。

5) 特征值選取。根據行業專家經驗和先驗知識,并結合基于數據驅動的特征相關性及貢獻度進行特征值選取,區分該特征是否可預知。其中,特征貢獻度及特征權重分配采用SHAP模型[23]分析結果為依據進行決策,通過將輸出值歸因到每一個特征的Shapely 值來評價模型每個特征對結果的貢獻度。經各特征對預測結果的正向、負向貢獻度分析,特征值貢獻度排序由高至低依次為功率類、溫度類、狀態類、壓強類。

2.2 模型訓練及預測

基于牽引變流器電機定子溫度狀態特征數據,將數據劃分為訓練集和測試集,通過訓練集和測試集分別擬合KFF-LSTM、LSTM、GRU、RNN模型,分別以1 步、4 步、8 步、16 步為跨度進行預測。選擇平均絕對誤差(MAE)、均方根誤差(RMSE)和R2分數綜合評價各模型預測準確度:

式中:E為平均絕對誤差;ERMS為均方根誤差;R2為R2 分數;y、與分別為真實值、預測值與真實值的平均值。其中,MAE 用于衡量預測值與真實值之間的平均絕對誤差,越小表示模型越準確;RMSE用于評價回歸模型預測結果與真實值的偏離程度,其單位與數據集一致,RMSE越低表明模型越穩定;R2 分數是綜合評價回歸模型的指標,越接近1表示模型綜合評價越高。

在滯后性評價方面,基于TLCC算法和數據集的波峰-波谷特性,通過逐步移動模型預測時間序列,計算預測與真實時序數據間的相關性,確定最強相關性所在的移動步數為滯后步數。詳細步驟為:將各模型的預測結果向時間軸的負或正方向移動i個時間步,再將平移后的各模型預測數據與真實值進行比較,計算Pearson相關系數ρ,

式中,Cov(·)為兩序列協方差,σy與分別為真實值與預測值的自標準差乘積。

根據式(9)計算定位移動i步的相關系數,當系數達到最大時定位移動步數i為滯后步,若i<0,則預測值超前真實值i步,反之滯后i步。

2.3 數據實驗結果

通過KFF-LSTM、LSTM、GRU(深度學習神經網絡時間序列)與RNN模型分別對某高速列車牽引變流器電機定子溫度數據集的前70%數據進行訓練集數據預測,對后30%數據集進行測試集數據預測,模型訓練不會接觸到測試集中的數據,實驗結果如圖4所示,由于訓練集中溫度的實際值參與模型訓練,故可以通過多次迭代使預測值與訓練值趨于一致,難以考量模型泛化性和在新數據集中的效果;測試集中溫度實際值不參與模型訓練,結果可以驗證模型的泛化性,更具備工程可實踐性。由圖4可見,在訓練集部分和測試集部分,本文方法KFF-LSTM 的預測結果曲線更貼合實際結果,即預測結果的準確度和滯后性都比其他模型的更優。

圖4 不同模型超前16步預測結果對比Fig. 4 Comparison chart of 16-step prediction results among different models

通過消融實驗,分別采用RNN、GRU、LSTM 及KFF-LSTM 模型進行超前1 步、4 步、8步、16 步時序數據預測,在訓練集與測試集中計算并對比MAE、RMSE、R2 評價指標,同時對比不同預測區間超前步數下不同方法的偏滯步數以評價不同模型的預測及時性,結果如表2所示。從表2可見:超前1步預測預測時,本文方法預測結果在預測準確性和及時性上要優于次優模型預測結果,但差別不大。隨著預測區間的延展,各模型預測準確性和及時性的差距開始增大,本文方法的預測結果始終優于其他模型。

表2 各模型預測效果對比Table 2 Comparison of prediction results among different models

實驗結果表明:

1) 預測準確度評價方面,KFF-LSTM 模型在超前1~16步預測的MAE、RMSE均比RNN、GRU和LSTM 方法的低。相對于其他3 種方法,KFFLSTM 模型訓練集的MAE 與RMSE 的最小誤差分別降低了9.4%~42.0%與4.6%~45.6%,KFF-LSTM模型測試集的MAE 與RMSE 的最小誤差分別降低了3.8%~18.0%與1.7%~10.8%;KFF-LSTM 模型預測結果的R2 分數亦優于其他3 種方法的R2 分數,在超前16步的訓練集與測試集預測結果的R2分數分別提升了4.3%與26.5%,預測的準確度有較大改善。

2) 預測及時性評價方面,隨著預測區間的超前步數增加,KFF-LSTM 模型的響應偏滯要顯著低于其他3種方法的響應偏滯。相對于其他3種方法,KFF-LSTM模型超前4步、8步和16步預測的偏滯步數的最少偏滯步數分別降低了50%、60%與40%。

綜上可知,相比于其他預測模型,KFF-LSTM模型具有更好的數據擬合能力,無論是在訓練集還是測試集的預測結果上均表現出更好的真值逼近與時間響應性能。

3 結論與展望

1) 面向長序列時間預測的準確性及滯后性問題,提出了一種KFF-LSTM 模型。該模型將未來可預知的特征數據引入模型的訓練及預測,對經典LSTM模型架構的輸出門、狀態更新單元及隱變量進行調整以優化預測準確度與響應的及時性。

2) 基于高速列車牽引變流器的實際運營數據進行了KFF-LSTM、LSTM、RNN 和GRU 模型的變流器電機定子溫度預測,通過消融實驗對比,KFF-LSTM 模型在MAE、RMSE 與R2 指標表征的準確度和偏滯步數表征的響應及時性均優于其他3種方法的最優結果。

3) 基于未來可預知特征的KFF-LSTM 長時序數據預測模型豐富了高速列車關鍵裝備的故障診斷與預警方法,其預測結果可以作為設備健康度診斷和視情維修計劃的重要參考,下一步研究工作的重難點是如何將算法延伸應用至高速列車裝備健康度定量分析及模型可解釋性拓展。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲欧美精品在线| 亚洲成人网在线播放| 高清不卡一区二区三区香蕉| 动漫精品啪啪一区二区三区| 精品少妇人妻无码久久| 91口爆吞精国产对白第三集| 国产特级毛片| 成年av福利永久免费观看| 在线看免费无码av天堂的| 午夜少妇精品视频小电影| 无码人妻免费| 美女国内精品自产拍在线播放| 国产黑丝视频在线观看| 亚洲人成网站观看在线观看| 国产欧美日韩精品综合在线| 91成人在线免费视频| 成人a免费α片在线视频网站| 国产精品网拍在线| 中文字幕无线码一区| 国产成人AV综合久久| 中文字幕亚洲第一| 永久免费精品视频| 伊人成人在线视频| 18禁不卡免费网站| a在线亚洲男人的天堂试看| 亚洲色图欧美在线| 色综合手机在线| 综合久久久久久久综合网| 日韩精品一区二区三区中文无码| 国产精品伦视频观看免费| 欧美a在线看| 69av在线| 亚洲成av人无码综合在线观看| 亚洲精品色AV无码看| 亚洲一级色| 欧美精品不卡| 国产精品人成在线播放| 中文毛片无遮挡播放免费| 免费三A级毛片视频| 亚洲大尺码专区影院| 成人精品在线观看| 国产乱人伦偷精品视频AAA| 日韩毛片在线视频| 好吊日免费视频| 丁香综合在线| 久久综合婷婷| 18禁高潮出水呻吟娇喘蜜芽| 亚洲欧洲日本在线| 成人a免费α片在线视频网站| 国产一二三区视频| 亚洲av无码久久无遮挡| 国产人成在线视频| 国产一级无码不卡视频| 内射人妻无码色AV天堂| 91免费观看视频| av在线5g无码天天| 91久久偷偷做嫩草影院电| 无遮挡一级毛片呦女视频| 亚洲AV电影不卡在线观看| 免费人成网站在线高清| 亚洲一区二区精品无码久久久| 国产精品美乳| 免费一级毛片| A级全黄试看30分钟小视频| 亚洲天堂精品视频| 国产欧美日本在线观看| 成人永久免费A∨一级在线播放| 欧美97欧美综合色伦图| 91精品啪在线观看国产| 无码内射在线| 久视频免费精品6| 亚洲国内精品自在自线官| 亚洲日韩国产精品无码专区| 最新亚洲人成无码网站欣赏网| 国产女人在线| 人妻免费无码不卡视频| 毛片久久久| 色综合综合网| 重口调教一区二区视频| 精品夜恋影院亚洲欧洲| 综合人妻久久一区二区精品| 日韩精品无码不卡无码|