李冬輝,劉功尚,高龍
(天津大學 電氣自動化與信息工程學院,天津,300072)
在現代的工、商業及民用建筑中,制冷空調系統在調節室內溫度和濕度方面發揮著重要的作用。冷水機組是制冷空調系統的核心組成部分,也是其主要耗能設備[1]。冷水機組傳感器負責實時監測系統性能及記錄數據。然而,在系統長期運行中,大多數傳感器無法始終保持正常運行狀態,不可靠的測量數據不僅會影響室內環境,也會導致不必要的能源浪費[2]。因此,尋找一種有效的冷水機組傳感器故障診斷方法對于保證制冷空調系統的正常運行有重要意義。
近年來,許多研究學者對制冷空調系統的傳感器故障診斷技術進行了深入研究。其中,基于數據驅動的傳感器故障診斷方法取得了較大的進展[3-6]。這類方法不需要建立精確的數學模型,也無需依賴專家經驗與知識。基于主成分分析(principal component analysis,PCA)的傳感器故障診斷方法是一種常用的數據驅動方法。張弘韜等[7]結合PCA 算法的原理給出了以Q 統計量、Q 貢獻率為檢驗標準的傳感器故障檢測和診斷流程,然后引入不同類型的傳感器故障,分析得到不同故障條件下的故障檢測和診斷特性。LI等[8]將密度聚類算法與PCA 相結合,用于冷水機組傳感器故障檢測與診斷,提高了故障檢測與診斷的靈敏度與可靠性。HU 等[9]提出了一種自適應PCA 的方法并將其用于冷水機組傳感器故障檢測策略中,提高了冷水機組傳感器在微小故障下的故障檢測準確率。然而,PCA 的方法對服從高斯分布的數據的特征提取效果較為明顯,但冷水機組系統的多變量數據具有非高斯性,同時其數據間具有非線性關系,在一定程度上限制了PCA 在冷水機組傳感器故障診斷中的應用。
深度學習技術因其具有處理大量數據并能夠從數據中有效提取特征的能力而被廣泛應用于傳感器故障診斷領域[10-11]。 卷積神經網絡(convolutional neural network,CNN)是深度學習中的一種常用方法,其能有效地提取數據中的深層特征。吳耀春等[12]將多傳感器振動信號轉換成多傳感器特征面集合并將其作為深度卷積神經網絡的輸入,利用深度卷積網絡結構實現對多通道特征面的自適應層級化融合與提取,最終由分類器輸出診斷結果。WEN 等[13]將傳感器信號轉換為二維圖像并將其作為LeNet-5 網絡的輸入,利用LeNet-5 網絡提取轉換后的二維圖像的特征,避免了手工選取特征,有效提高了傳感器故障診斷的準確率。
長短時記憶網絡(long short-term memory,LSTM)是深度學習技術中另一種重要的方法,作為循環神經網絡(recurrent neural network,RNN)的一種變體,LSTM可以較好地提取數據中存在的時序特征,同時其特殊的門控結構可以在一定程度上解決RNN中的梯度消失問題。GAO等[14]將雙向LSTM和典型相關分析相結合,該方法能夠自動從冷水機組系統原始運行數據中提取非線性特征和時間特征,然后通過設計殘差生成器來生成方向殘差向量,并通過累積殘差向量法提高了傳感器故障的可檢測性。LEI等[15]提出一種基于LSTM的端到端的故障診斷框架,利用LSTM直接從多元時間序列數據中學習特征,通過LSTM的門控機制捕獲長期依賴關系,結果表明,該方法能夠有效地對多個傳感器采集的原始時間序列信號進行故障診斷。
針對以上2種方法的特點,許多學者考慮將兩種方法相結合用于傳感器故障診斷。XU等[16]將多個傳感器采集到的信號轉換成多通道圖像,然后利用CNN對圖像進行特征提取與融合,后將CNN輸出的特征輸入到LSTM中提取時間特征,最終輸出故障診斷結果。ZHAO 等[17]提出一種CNNBLSTM的模型,首先通過CNN提取局部特征,然后利用雙向LSTM提取時間依賴關系,研究結果表明該模型的性能優于單一的CNN或LSTM的性能。
CNN 與LSTM 相結合的方法雖取得了一定程度的進展,但仍存在一定的不足。首先,CNN 雖然可以提取傳感器數據的局部特征,但其卷積核尺度較為單一,且卷積核尺度的選取會影響故障診斷的效果。其次,該方法中LSTM最終的輸出僅依賴于最后時刻隱藏狀態的輸出,在輸入序列過長時存在丟失序列信息的問題,且傳感器時序數據中不同時間節點數據的重要程度常常不同,這使得LSTM的輸出結果無法較好地保留傳感器時序數據的全局信息。為解決上述問題,本文作者提出一種基于Inception-LSTM-Attention 的冷水機組傳感器偏差故障診斷方法,該方法通過Inception模塊提取冷水機組傳感器數據的多尺度實時特征,同時在LSTM 網絡中加入注意力機制,有效解決LSTM無法較好地保留傳感器時序數據全局信息的問題。該方法無需先驗知識與人工特征的提取,可以直接從冷水機組傳感器數據中提取特征信息,實現端到端的故障診斷。通過壓縮式冷水機組實驗平臺采集傳感器數據,并通過實驗驗證和對比分析驗證本文所提方法的有效性。
CNN 因其具有參數共享和稀疏連接的優點而被廣泛應用于計算機視覺領域。CNN 可以通過卷積、池化等操作從輸入數據中提取特征,具有強大的特征提取能力。典型的CNN 結構主要包括卷積層、池化層和全連接層[18]。
卷積層的主要作用是對輸入數據進行特征提取,卷積層中有多個卷積核,每個卷積核均以稀疏連接的方式遍歷輸入數據并進行卷積操作,后經過激活函數進行非線性映射得到輸出特征圖。具體計算過程如下:
式中:f(x)為輸入x經過激活后的輸出值。
池化層的作用是對卷積層的輸出進行下采樣操作,主要包括最大池化和平均池化2種方式。池化操作一方面可以使提取到的特征更加抽象,過濾冗余信息,另一方面可以減少網絡參數,加快模型訓練速度。本文采用最大池化方式,具體計算過程如下:
經過多次卷積、池化操作后,通過全連接層將提取到的特征信息映射到輸入數據對應的標簽上,對于本文的多分類任務而言,可用Softmax分類器得到最終的分類結果。
Inception模塊是SZEGEDY等[19]提出的一種新的神經網絡結構,其核心思想是在同一個卷積層中設置多個通道來增加網絡寬度,每個通道分別使用不同尺度的卷積核來對輸入數據進行特征提取,本文使用結構如圖1所示的Inception 模塊。Inception模塊有兩個特點:一是使用不同尺度的卷積核對輸入數據進行卷積或池化操作,并最終在特征維度上進行拼接,多尺度的卷積核可以使提取到的特征更為豐富,增加了網絡寬度,提高了網絡對尺度的適應性;二是每個通道都引入了1×1的卷積核,增加網絡非線性能力的同時降低了計算的復雜程度。

圖1 Inception模塊結構Fig.1 Structure of Inception module
LSTM是HOCHREITER等[20]針對RNN在訓練時易出現的梯度消失和梯度爆炸問題所提出的一種改進模型。LSTM的主要特點是其引入了門控機制和細胞狀態的概念,即通過門控機制來提高或降低信息到細胞狀態的能力,有效克服了RNN 處理長期依賴方面的不足。
LSTM 的結構如圖2所示。圖2 中,“+”和“×”分別表示加法運算和乘法運算。LSTM單元模型包括遺忘門ft、輸入門it和輸出門ot。其中遺忘門的作用是將細胞狀態中的信息進行選擇性遺忘,即決定上一時刻(t-1)的細胞狀態ct-1有多少保留到當前時刻的細胞狀態ct中;輸入門負責更新細胞狀態,將新的信息選擇性地記錄在當前時刻的細胞狀態ct中;輸出門則用來控制當前時刻的細胞狀態ct輸出到LSTM 單元輸出值ht中的比例。LSTM單元的具體表達式如下:

圖2 LSTM結構Fig.2 Structure of LSTM
式中:Wf,Wi,Wo和Wc分別為遺忘門、輸入門、輸出門、輸入單元狀態的權重;bf,bi,bo和bc分別為遺忘門、輸入門、輸出門、輸入單元狀態的偏置;ht-1為上一時刻的輸出;xt為當前時刻的輸入;σ和tanh分別代表sigmoid函數和tanh函數。
注意力機制是受人腦思考問題時注意力資源分配機制的啟發而提出的一種深度學習方法,最初被用于自然語言處理領域[21]。人類大腦在思考問題時會將更多注意力集中在更為重要的區域,以獲取更多有價值的信息,而對于不重要的區域則加以抑制,排除無用信息的干擾。本文將注意力機制與LSTM相結合,通過給LSTM不同時間步的隱藏輸出分配不同權重系數的方式來提高重要信息的影響程度,降低非重要信息的干擾,最大化保留傳感器時間序列的全局信息,在一定程度上解決因輸入序列過長而存在的信息丟失問題。
本文提出一種將Inception 模塊與融合注意力機制的LSTM 相結合的Inception-LSTM-Attention網絡模型,以提高冷水機組傳感器偏差故障的診斷準確率。該模型充分利用Inception 模塊的多尺度特征提取能力挖掘冷水機組傳感器序列的實時特征,同時利用融合注意力機制的LSTM學習傳感器時序數據中存在的時間相關關系,最大化提取時序數據中的全局信息。此外,在Inception-LSTM-Attention串行模型的基礎上增加了跳躍連接支路緩解網絡中存在的梯度消失問題,最終實現對冷水機組傳感器的偏差故障診斷。
本文提出的Inception-LSTM-Attention 模型結構如圖3所示。將冷水機組各個傳感器采集到的數據進行重構,以重構得到的二維數據作為網絡模型的輸入。圖3中,輸入部分的表示第M個輸入樣本中第1 個時間步下第1 個傳感器的讀數信息。首先通過Inception 模塊對輸入樣本進行多尺度的特征提取,Inception模塊因其自身包含了多個不同尺度的卷積核而可以自適應地從輸入樣本中提取深層特征,一方面無需進行人工特征的提取,避免了對專家知識和經驗的依賴,另一方面采用不同尺度的卷積核對輸入進行特征提取,可以最大化地提取故障數據中的特征。然后,將Inception模塊進行特征提取后的結果輸入到LSTM中,提取不同傳感器存在的不同時間相關性,進一步學習時序數據中存在的時間依賴關系。同時,在LSTM中加入注意力機制,給LSTM不同時間步的隱藏輸出賦予不同的權重,目的是讓LSTM最終的輸出綜合各個時間節點的輸出,提升重要信息的影響力,最大程度地保留時間序列的全局信息,使得最終的輸出結果不僅僅是依賴最后一個時間步的隱藏狀態。此外,本文在Inception-LSTM-Attention 串行模型的基礎上設計了跳躍連接支路,即將Inception模塊的輸出與LSTM-Attention的輸出在最終輸出前通過concat層進行拼接,緩解網絡中存在的梯度消失問題。最終通過Softmax分類器輸出分類結果,實現故障診斷。

圖3 Inception-LSTM-Attention模型結構Fig.3 Structure of Inception-LSTM-Attention model
圖4所示為基于Inception-LSTM-Attention的冷水機組傳感器偏差故障診斷流程,其診斷流程主要分為以下幾個步驟。

圖4 冷水機組傳感器偏差故障診斷流程Fig.4 Deviation fault diagnosis processes of chiller sensor
1)從壓縮式冷水機組實驗平臺中采集傳感器數據并進行分組和標簽化處理,各組分別對應各個傳感器發生故障和無傳感器發生故障的正常情況。
2)將偏差故障引入除無故障組別外的各組數據中,并進行Z-score標準化。同時按照4:1的比例將各組數據劃分為訓練集和測試集。
3)初始化網絡參數,使用訓練集對網絡模型進行訓練,模型提取特征信息并通過反向傳播更新網絡參數。本文使用交叉熵函數作為模型訓練的損失函數,其表達式如式(10)所示,并采用Adam優化算法更新參數。
式中:yi與分別為第i個樣本的實際概率分布與預測概率分布;M為樣本數量;L為損失值。
4)判斷網絡訓練次數k是否達到預先設定的迭代次數N,如果是,那么停止訓練并保存模型,否則繼續訓練。
5)將測試集數據輸入到已訓練好的網絡模型中進行故障診斷,輸出診斷結果。
本文的實驗數據集來自壓縮式冷水機組實驗平臺,如圖5所示。該實驗平臺主要包括壓縮機、冷凝器、蒸發器、電子膨脹閥、主控柜以及讀取冷水機組傳感器數據的上位機等部分。本文主要診斷10 種冷水機組傳感器的偏差故障,因冷水機組中多個傳感器同時發生故障的概率極低,故本文只考慮同一時刻只有1 個傳感器發生故障的情況。

圖5 壓縮式冷水機組實驗平臺Fig.5 Experimental platform of compression chiller
實驗中,打開設備使其正常工作,每隔1 min采集1次數據,剔除異常數據后共得到42 416組數據。將數據按照順序等分為11份,分別對應10種傳感器發生故障和1種正常情況,并對各份數據進行標簽化處理,同一標簽下的數據按照4:1劃分為訓練集數據和測試集數據。數據集具體描述如表1所示。

表1 實驗數據集Table 1 Data set of experiment
根據各個傳感器的精度,考慮到所加偏差故障應在傳感器讀數誤差的允許范圍之外,且偏差故障不宜過大,據此確定壓力類、溫度類各傳感器的偏差故障擬合范圍。同時,為保證實驗結果的完備性,在各傳感器的偏差故障擬合范圍內設定相應的故障步長,使得各傳感器在實驗中均包含了多個不同程度的正負偏差故障。對各個傳感器數據分別擬合偏差故障的具體情況如表2 和表3所示。引入偏差故障后,采用Z-score 標準化對數據集進行處理,Z-score標準化的公式如下:

表2 壓力類傳感器偏差故障擬合情況Table 2 Simulation of deviation fault of pressure sensor

表3 溫度類傳感器偏差故障擬合情況Table 3 Simulation of deviation fault of temperature sensor
式中:μ為數據的平均值,σ′為數據的標準差。經過標準化處理后的數據均值為0,方差為1。
經過多次傳感器故障診斷實驗并調整模型參數,得到最終的模型結構參數。在本文提出的Inception-LSTM-Attention 模型中,輸入的維度為20×10,其中20 表示輸入樣本中包含的采樣點個數,10表示傳感器數量。Inception模塊中共有4個并行通道,分別對輸入進行特征提取,其中卷積層的結構參數(1,1,32)/(3,3,32)含義如下:首先通過1×1 的卷積核進行特征提取(通道數量為32個),后串行連接3×3的卷積核(通道數量為32個);LSTM 的神經元個數設置為200;最后加入全連接層,使用Softmax 激活函數實現對故障類別的映射,得到故障診斷結果。具體的模型參數如表4所示。表4 中,輸出尺寸(None,20,10,1)分別指圖像的批次、高度、寬度和深度。

表4 模型參數Table 4 Parameters of model
模型的訓練設置如下:采用Adam優化器優化交叉熵損失函數,學習率為0.001,批次取值為64,使用dropout 抑制過擬合,且dropout 為0.4,迭代次數為20。
3.3.1 模型訓練過程
利用無傳感器發生故障和10 種傳感器分別發生故障的11 組數據進行故障分類,驗證本文所提方法的有效性。圖6所示為Inception-LSTMAttention模型的訓練過程。從圖6可以看出:隨著迭代次數的增加,模型在訓練集的診斷準確率逐漸增加,同時損失函數值逐漸減小;當迭代次數為15時,診斷準確率和損失函數值趨于平穩。

圖6 模型訓練過程Fig.6 Model training process
3.3.2 模型測試結果與分析
模型訓練完成后保存模型,并使用測試集來測試模型性能。
1)壓力類傳感器。壓力類傳感器得到的測試結果分別如表5、表6和圖7所示。
由表5、表6和圖7可知:P1~P4壓力傳感器的偏差故障診斷準確率均隨著所加壓力偏差故障的增大而增大,且正負偏差故障的故障診斷準確率有較好的對稱性。對于P1 和P4 的較小偏差故障(±0.02 MPa),其故障診斷準確率均在90.9%以上;對于P2和P3的較小偏差故障(±0.05 MPa),其故障診斷準確率均在88.5%以上。P1~P4壓力傳感器的偏差故障診斷平均準確率分別為96.76%,95.21%,94.49%和96.59%,即本文提出的Inception-LSTMAttention模型能夠對冷水機組壓力類傳感器的偏差故障進行有效診斷,且有較高的準確率。

圖7 壓力類傳感器在不同壓力偏差故障下的故障診斷準確率Fig.7 Fault diagnosis accuracy rate of pressure sensors under different pressure deviation faults

表5 P1和P4在不同壓力偏差故障下的故障診斷準確率Table 5 Fault diagnosis accuracy rate of P1 and P4 under different pressure deviation faults

表6 P2和P3在不同壓力偏差故障下的故障診斷準確率Table 6 Fault diagnosis accuracy rate of P2 and P3 under different pressure deviation faults
2)溫度類傳感器。溫度類傳感器得到的測試結果分別如表7~9和圖8所示。

圖8 溫度類傳感器在不同溫度偏差故障下的故障診斷準確率Fig.8 Fault diagnosis accuracy rate of temperature sensors under different temperature deviation faults
由表7~9 和圖8 可知:T1~T6 這6 個溫度傳感器的偏差故障診斷準確率均隨著所加溫度偏差故障的增大而增大,且正負偏差故障的故障診斷準確率有較好的對稱性。對于T1,T5和T6的較小偏差故障(±0.3 ℃),T3 和T4 的較小偏差故障(±1.0 ℃)以及T2的較小偏差故障(±1.5 ℃),其故障診斷準確率均在87.6%以上。T1~T6 這6 個溫度傳感器的偏差故障診斷平均準確率分別為96.01%,98.54%,94.45%,94.28%,95.14%和96.95%,即本文提出的Inception-LSTM-Attention 模型能夠對冷水機組溫度類傳感器的偏差故障進行有效診斷,且有較高的準確率。

表7 T1,T5和T6在不同溫度偏差故障下的故障診斷準確率Table 7 Fault diagnosis accuracy rate of T1,T5 and T6 under different temperature deviation faults
從壓縮式冷水機組的各壓力、溫度傳感器的偏差故障診斷結果來看,本文提出的Inception-LSTM-Attention模型可以對各傳感器不同程度的正負偏差故障進行準確、有效地診斷。Inception-LSTM-Attention模型因其強大的特征提取能力可以從壓縮式冷水機組傳感器數據中充分挖掘傳感器序列的多尺度實時特征及傳感器時序數據中存在的時間相關關系,并最終高效地完成故障診斷。
為驗證本文所提方法的可靠性,將本文方法與PCA,CNN,Inception和Inception-LSTM這4種方法進行對比。其中CNN,Inception 和Inception-LSTM這3種方法的具體結構參數如表10所示。

表10 不同方法結構參數Table 10 Structure parameters of different methods
分別在相同的數據集上使用不同對比方法進行傳感器偏差故障診斷實驗。
3.4.1 壓力類傳感器
壓力類傳感器得到的測試結果如表11所示。

表11 不同方法下壓力類傳感器偏差故障診斷準確率Table 11 Deviation fault diagnosis accuracy rate of pressure sensors under different methods %

表8 T3和T4在不同溫度偏差故障下的故障診斷準確率Table 8 Fault diagnosis accuracy rate of T3 and T4 under different temperature deviation faults

表9 T2在不同溫度偏差故障下的故障診斷準確率Table 9 Fault diagnosis accuracy rate of T2 under different temperature deviation faults
3.4.2 溫度類傳感器
溫度類傳感器得到的測試結果如表12所示。
由表11 和表12 可知:對于壓縮式冷水機組中的各壓力、溫度傳感器,本文所提方法的傳感器偏差故障診斷準確率均比其他4種方法的高,模型表現較為穩定。基于PCA 的故障診斷方法需對輸入數據進行降維處理,會在一定程度上丟失部分數據信息。基于CNN 的方法僅包含單一尺度的卷積核,無法充分提取冷水機組傳感器數據的實時特征。基于Inception 模塊的方法雖有多尺度的卷積核,在一定程度上提高了網絡的特征提取能力,但卷積/池化結構無法充分提取冷水機組傳感器數據中包含的時序特征。基于Inception-LSTM 的方法將Inception模塊的多尺度特征提取能力與LSTM的時序特征提取能力相結合,可以在一定程度上解決Inception 模塊中僅包含卷積/池化結構而無法學習傳感器時序數據中存在的時間相關關系的問題,但該方法中LSTM的輸出僅依賴于最后時刻隱藏狀態的輸出,無法較好地保留時序數據中的全部關鍵信息。而本文所提方法則是在Inception-LSTM 模型的基礎上加入了注意力機制,使得LSTM最終的輸出綜合了各個時間節點的輸出,而不僅僅是依賴最后一個時間步的隱藏狀態,同時,注意力機制可以提高重要信息的影響程度,降低非重要信息的干擾。最終的對比實驗結果表明,本文提出的基于Inception-LSTM-Attention 的方法取得了最高的故障診斷準確率,體現了所提方法的有效性及優勢。

表12 不同方法下溫度類傳感器偏差故障診斷準確率Table 12 Deviation fault diagnosis accuracy rate of temperature sensors under different methods
1)本文方法直接將經過偏差故障擬合并標準化處理后的冷水機組傳感器數據作為網絡模型的輸入,利用Inception-LSTM-Attention 模型進行端到端的故障診斷,避免了先驗知識及人工特征提取等主觀因素帶來的局限性。
2)本文方法針對冷水機組中的各壓力、溫度傳感器的偏差故障診斷平均準確率均在94%以上,且對于各壓力傳感器的較小偏差故障診斷準確率保持在88.5%以上,各溫度傳感器的較小偏差故障診斷準確率保持在87.6%以上。同時,對各傳感器的正負偏差故障的診斷準確率均有較好的對稱性。
3)本文方法將Inception 模塊與融合注意力機制的LSTM相結合,使模型不僅可以提取傳感器時序數據的多尺度實時特征,還可以捕捉不同傳感器存在的不同時間相關關系,同時增加注意力機制來提高時序特征中重要信息的影響程度,使得LSTM最終的輸出綜合了各個時間節點的輸出,更好地保留了傳感器時序數據的全局信息,充分刻畫了冷水機組傳感器數據中的復雜數據特征。本文方法在冷水機組各傳感器上的偏差故障診斷準確率均比PCA, CNN, Inception 和Inception-LSTM這4種對比方法的高,模型表現比較穩定。