張鈺璽


一、引言
近些年由于氣候變化導致了自然災害頻繁發生。其中由于強降雨造成的洪澇災害,威脅著各地區居民的人身及財產安全。據水利部統計,就2020年入汛以來,截止至7月9日,全國就有16個省份有198條河流水位超過預警線之上。受災人數達3020萬人次,財產損失共計617.9億元。城市的排水管網系統與民生問題息息相關。排水管網遍布于城市的地面之下,通過在管道中布置大量的傳感器,來實現管道中的水位、污水流速等數據的采集。除了這類數據采集終端,還存在控制終端用來控制閥門的開合,或是監控某部分設施的實時狀態。這些終端設施搭配后臺服務器形成了一個完整的排水管網監控管理系統。硬件終端的可靠性直接決定了整個系統能否及時對該城市的排水系統狀態進行反饋與控制。
這就要求系統的操作人員能夠及時發現排水系統中所存在的故障或是對故障進行預警,從而保證該系統能夠正常運作。因此需要研究出一個故障檢測方法,能夠通過現有數據結合算法來鑒別某部分數據是否存在問題從而實現對設備故障的檢測,不僅如此還要能利用現有數據預測出數據的發展趨勢,發現故障隱患并及時解決。
神經網絡模型在故障檢測以及故障預測中有著廣泛的應用,本文對兩種神經網絡模型進行了分析,為找出適合排水系統故障檢測的方法進行了研究。
二、神經網絡模型介紹與應用
在排水系統中,能夠得到的可以反應故障的數據包括時間、蓄電池狀態、油溫、環境溫度、水位等。蓄電池的狀態影響著其他各部件能否正常工作,油溫過低可能也代表某部件發生了故障,做功減少使得部件不能夠正常運行。環境溫度在短時間內發生較大的改變,可能是溫度傳感器自身發生了故障,或是外界有物質泄露導致環境溫度發生了改變。實時水位則能夠間接的反應出排水管網的擁堵情況以及是否管網發生了破損。
因此,對于排水系統的故障檢測需采取數據驅動的方法,根據數據的異常來推斷出是否要發生故障,以及識別故障的發生部位。
(一)BP反向傳播神經網絡
BP神經網絡全稱為反向傳播神經網絡,是一種線性權重的激活函數模型。其每一層上都存在著多個代表神經元的節點。層與層任意兩個節點之間都存在連接關系,同一層上任意兩個節點之間不具有相互連接關系。輸入一個向量,對向量加權處理后再交給隱含層神經元的激活函數中,再將函數的輸出值進行加權處理從而最終交給輸出層加權處理進而得到輸出的值。在處理過程中可能會出現得到的輸入層響應誤差偏大的情況,BP神經網絡就會將誤差信號進行反饋調節,就是從輸出層經過各中間層逐層向輸入層進行傳播,并調整各層連接的權值。通過輸出層的誤差信號反復反向傳播并調整各個連接點的權值,使得最終輸出與輸入的誤差達到最小,從而提高BP網絡對輸入信號響應的準確度。如果通過公式來表示,其中有m個輸入和n個輸出,還有輸入層(I)、若干隱含層(O)以及輸出層(H)。BP神經網絡模型是通過沿著相對誤差平方和的最快的下降方向,不斷的修正權值和閥值,使得誤差函數值達到最小。誤差函數的表達式如下:
其中為輸出的結果; 為實際值。BP神經網絡結構如圖 1所示:
BP神經網絡的學習過程就是將提供的排水系統數據輸入到神經網中,經過處理后輸出,輸出不滿足要求,再進行神經元間連接權值進行調整,使得輸出的值在預計范圍內。此時就完成了對一份樣本的學習過程,進而將學習后的新知識保存到樣品庫中。排水系統故障檢測過程利用BP神經網絡,將輸出的計算結果與正常范圍內結果進行對比,從而分析出故障原因。并且在故障檢測結束后還能通過新得到的故障數據再進行學習,拓展知識庫使得結果的誤差變得更小。
利用BP神經網絡對排水系統進行故障檢測多與故障樹方法相結合,利用故障樹找到可能發生某個故障的全部原因,將故障現象作為輸入值,通過訓練學習得到的樣本庫輸出結果,所得到的結果就是故障原因。
BP神經網絡雖然十分經典,但它也具有一定的缺點,本質上BP神經網絡是線性權函數的接近,同一層級間各個數據之間并沒有聯系,如果同一層級各個數據間前后存在聯系時,BP神經網絡就會變得不適用,如果不把前一個數據作為后一個數據的輸入的話,本質上該算法無法挖掘到數據產生的模式。對于挖掘時間序列內部模式的需求就變得無法滿足。還需要結合其他模型才能夠達到故障預測目的。
(二) LSTM長短期記憶神經網絡
LSTM神經網絡全稱為長短期記憶網絡,它是在循環神經網絡的基礎上被開發研究出來的。循環神經網絡通過在不同層之間的神經元間建立的權連接來使不同節點的數據前后去的關聯,因此循環神經網絡能夠很好的解決BP神經網絡無法解決的序列問題。但正是因為這樣,需要把上次計算得到的輸出變為下一次計算的輸入,這實際上是一個迭代和嵌套函數的過程。在數據量過大的情況下,由于不斷的進行鏈式求導計算,就很可能出現指數爆炸的情況,也就是會產生梯度消失和梯度爆炸問題。還可能會由于序列過長使得重要信息在一開始就被遺漏。
為了克服這些問題, 在RNN的基礎上,Hochreiter和Schmidhuber提出了長短期記憶網絡的概念。引入了輸入門、輸出門以及遺忘門細胞機制,其基本結構如下圖 2所示:
在門內可以對信息進行調節,并且能夠知道數據序列中哪些數據需要保留,哪些數據可以被刪除。隨后沿著長鏈進行數據傳遞以實現數據預測的目的。
細胞狀態的更新通過輸入門來完成。在這一層會將上一層得到的隱藏狀態信息結合當前信息傳輸給sigmoid函數。并將值調整在[0,1]之間,從而決定要更新哪些信息。
上一層的到的隱藏狀態信息和當前信息還需要得到一個新的候選值向量。這個過程經由tanh函數來實現,將sigmoid函數的輸出值與tanh函數的輸出值進行相乘,利用sigmoid函數來決定tanh函數的輸出值中哪些數據需要得以保留。
遺忘門負責決定有哪些數據需要遺忘,哪些數據需要被記憶,通過得到前一個隱藏狀態信息再結合當前輸入的信息經由sigmoid函數來生成一個在[0,1]區間上的值,值越趨近于1則應被記憶,反之應該被遺忘。
由于排水系統所采集到的流量、壓力等數據具有較強的時序性。并且在排水系統故障診斷的研究中,隨著時間的增加,傳感器的穩定狀態也會相應的發生改變,因此LSTM處理時間序列的能力能夠很好的應用在排水系統故障診斷中。
輸出門能夠確定下一個隱藏狀態的值。同樣的,將一個隱藏狀態和當前輸入傳遞到sigmoid函數中,更新現有的細胞狀態,再講細胞狀態傳遞到tanh函數中。將過程中得到的兩個輸出相乘,從而確定隱藏狀態應攜帶的信息。最后將隱藏狀態作為當前細胞的輸出,把現在的細胞狀態以及隱藏狀態傳遞到下一段時間序列中。
細胞狀態的更新是通過將前一層的細胞狀態與遺忘向量逐點相乘,所得到的值越趨近于0,證明這個值越應該被丟棄。進而將該值與輸入門的輸出值逐點相加,在此過程中將神經網絡所發現的新信息加入到細胞狀態中,就完成了細胞狀態的更新。
基于上面這些特性,LSTM算法具有很好的提取數據時序特征的能力,但隨著長鏈進行傳遞,LSTM所需要訓練的權重也會變多,因此LSTM神經網絡的缺點是訓練過程復雜,需要多次訓練才能夠得到收斂的誤差函數。
LSTM算法對故障進行預測,可以將無故障狀態下的水位,水體流速,環境溫度等數據進行訓練。在訓練完成后將數據輸入訓練集,對結果進行預測,通過設定閾值來對預測數據進行對比,在閾值之外的數據即為異常。借助可視化手段也能夠直觀的看出真實數據是否脫離正常狀態。以達到對故障進行檢測的目的。
(三)CNN卷積神經網絡
CNN神經網絡全稱為卷積神經網絡,是一種典型的前驅神經網絡,常用在圖像識別、文字處理等領域。具有很好的濾除噪聲以及針對提取出來的特征信息進行分類歸納的能力。從神經網絡的結構上來看,CNN主要分為卷積層、池化層和全連接網絡三大部分組成。
在卷積層通過卷積核對輸入數據的局部特征進行卷積運算,實現對空間特征的提取。同時還實現了對數據的降維操作,簡化了后續的訓練過程。對于排水系統來說,傳感器采集到的管路數據種類繁多,數量龐大,尋找合適的特征提取方式顯得尤為重要。卷積層中各個層級的權值相等,共用同一個卷積核,每次使用相同步長遍歷輸入數據,從而大大減少卷積層的參數,防止參數過多造成的過擬合現象。因此看起來CNN和排水系統數據適應性較強,便于對排水系統數據進行特征提取操作。
池化層和卷積層的作用相近,能夠用來降低數據的原始特征數量。他們的不同點在于,數據通過卷積層,會使矩陣深度發生改變,然而經過池化層不會使矩陣的深度發生改變,而是會改變節點矩陣的大小。
最后一層是全連接層,這一層將會采用softmax函數將處理后的輸出根據提取出來的特征進行分類。
雖然CNN具有良好的提取空間特征的能力,但也會出現訓練結果沒有收斂在全局最小值、在池化層丟失大量有價值信息的情況,所以在使用卷積神經網絡對排水系統的故障分類時需要針對這些缺點來進行改進。
三、結語
對排水系統進行故障診斷,主要采取數據驅動的方法,結合神經網絡輔以故障樹、支持向量機等其他方法來實現。本文介紹了BP神經網絡、LSTM神經網絡與CNN神經網絡的工作原理,針對排水系統的故障檢測分析了兩種神經網絡在數據處理中存在的優缺點,BP神經網絡更加經典,能夠解決求解內部機制復雜的問題,但由于其同一層級間的數據沒有關聯,導致基于時間序列的數據不能夠被處理。使用LSTM神經網絡很好的解決了時間序列的問題,使得同一層級間的數據能夠相互關聯,但相對于BP神經網絡,LSTM神經網絡學習的代價更高,訓練的難度更大。因此對排水系統的故障診斷若使用BP神經網絡則還需要佐以其他算法,形成新的組合模型來進行基于時間序列的故障檢測。若使用LSTM算法在訓練的過程中則需要更大的開銷,訓練復雜度也會大大降低。CNN神經網絡能夠有效的提取排水系統數據的空間特征,降低維度,提高模型的學習率,但也存在丟失有價值信息,處理時序數據能力較差的特點。因此如果將算法進行融合,取長補短,研究出更適合排水系統故障診斷的算法,是進一步需要研究的問題。