葉暉云 韓 華 任正雄 楊鈺婷 劉飛天
(上海理工大學,上海)
隨著碳中和目標的提出,能源體系正在發生巨大的變化[1]。受安裝、運行維護及系統本身復雜性等因素的影響,制冷系統可能發生故障,帶故障運行會引發能源消耗增加、舒適性下降等問題[2],周期性地對硬件進行維修有助于提高運營措施經濟性和硬件運行性能[3]。以機器學習的方法進行制冷系統故障檢測與診斷是十分有效的措施,但是訓練一個性能優良的模型往往需要大量的數據,而收集大量已知類別的數據經濟性較差,因此機器學習的方法往往局限于科研項目[4]。解決該局限性可以采用遷移學習的思路,將用于數據豐富對象的、經過訓練和驗證的機器學習模型,通過一定的遷移手段,運用到數據數量有限或使用年限較長的制冷系統中。近年來,遷移學習主要運用于建筑自動控制或能耗預測。Chen等人構建了基于深度神經網絡的遷移學習模型,利用神經網絡實現了自動控制[5];Fan等人利用源建筑能耗數據進行預先訓練得到預測模型,使用不同的策略對目標建筑能耗進行了預測[6];Qian等人通過調試基于已知數據訓練的TrAdaBoost(TAB)算法對建筑HVAC系統能耗進行預測評估,主要解決了系統中的能耗預測問題[7]。部分學者將遷移學習應用于制冷系統故障診斷中。Zhu等人提出用異構數據標準化處理原始數據集,并通過添加域適應系數使神經網絡模型能遷移不同螺桿式冷水機組的信息,完成故障診斷[8];范雨強等人采用不平衡數據技術處理數據集,提取離心式冷水機組信息,采用遷移的方法實現了螺桿式冷水機組的故障診斷[9]。
目前的制冷系統故障診斷主要針對單臺機組已有工況及故障數據進行,或者在不同機組間對已有故障信息進行遷移,對于新工況數據缺乏這一普遍問題鮮有研究。本文針對制冷系統新工況故障數據難以獲得的問題,提出對數據集進行方差選擇、調整分布、進一步擠壓數據空間等多重處理,縮小不同工況數據之間的差異,并基于TAB算法提出不同基分類器的遷移診斷方法,應用于離心式冷水機組典型故障的遷移診斷,并進行了詳細的對比分析,實現了從已有工況數據到新工況數據的故障遷移學習。有效實現了機組新工況數據匱乏時,利用已有工況信息改善新工況下的故障診斷性能,有望在保證故障診斷性能的前提下縮減實驗成本。
TAB算法是AdaBoost(AB)算法[10]在遷移學習上的衍生算法。AB算法利用boosting(一種框架算法)技術,通過不斷迭代訓練,將弱分類器(默認采用決策樹decision tree, DT)通過規則整合成性能更優異的分類器。AB算法對屬于同一域的數據集進行權重迭代更新,而TAB算法則可同時對源域和目標域數據集進行權重迭代更新,減小源域中與目標域中樣本差異較大的樣本的權重,增大相似樣本的權重,從而提高目標域與源域的相關性,利用源域知識增強模型對目標域數據的診斷能力[11]。
TAB算法流程如圖1所示,需要2個已有標簽的訓練數據集Td(different-distribution)和Ts(same-distribution)、未標記的目標域測試數據集S、1個基分類器Learner和迭代次數N,其中,Td是與S不同域的源域數據集,含n個數據,Ts是與S相同域的目標域數據集,含m個數據,n?m。

圖1 TAB算法流程圖
算法初始化:
(1)
式中ω1,i為第1次循環中第i個數據的權重。
初始權重向量分布集,確保模型在遷移學習的初始階段能利用源域已知數據知識進行一定正確率的診斷。設置學習率參數β,根據迭代次數建立N次的迭代循環:
1) 對每個權重進行歸一化處理,即用每個權重除以權重總和,確保它們的比例保持相同,以使模型調用的權重在合適的范圍內。
(2)
式中pt為第t次循環歸一化后的權重;ωt為第t次循環的權重;ωt,i為第t次循環中第i個數據的權重。
2) 為了方便分類,定義1個基分類器,根據合并后的訓練數據T(Ts與Td)及T上的歸一化權重分布pt和未標記數據S,得到1個x→y的標簽集ht。
3) 計算模型在Ts數據集得到的標簽的錯誤率εt。
(3)
式中ht(xi)為第t次循環基分類器對數據xi進行診斷得到的類別;c(xi)為數據xi的真實類別。
4) 設定2個學習率參數。
(4)
(5)
式(4)、(5)中βt為第t次循環中目標域數據更新權重的學習率;β為源域數據更新權重的學習率,是一個與源域數據量n、迭代次數N相關的常數。
5) 更新下一次迭代的數據權重ωt+1,i。與目標域適應的源域數據具有更大權重;反之,具有更小權重。
(6)
6) 獲得決策函數hf(x),最終的分類器將采用該函數對目標域數據集S進行分類。
(7)
本文針對制冷系統故障診斷中的輸出進行了一定更改:將輸出的二分類強分類器更改為經過迭代更新權重設置的多分類強分類器。
基于TAB算法的遷移分類能力能夠解決制冷系統診斷中新工況數據缺失的問題,因此選擇它建立故障診斷模型。圖2為故障遷移診斷模型示意圖。

注:AB、RCV、RF為基分類器。圖2 故障遷移診斷模型示意圖
對包含源工況數據集與目標工況數據集的原始數據集進行數據清洗,分為包含大量源工況已知數據、少量目標工況已知數據的訓練數據集與包含了大量目標工況未知數據的測試數據集。將經過多重數據處理的訓練數據集、測試數據集用于基于不同基分類器(AB、RCV、RF)、通過TAB算法搭建的不同模型(TAB_AB、TAB_RCV、TAB_RF)以進行故障診斷。
其中,RCV算法的核心思想是利用最小二乘估計法,在離差平方和上增加一個L2范數的懲罰項,即正則化下的最小二乘法[12]。
(8)
式中x為特征矩陣;y為因變量;a為正則化參數;x為線性回歸系數。
RCV算法內置交叉驗證對正則化參數進行調整,避免過擬合,得到更加可靠穩定的分類器。
而RF算法是一種集成算法,其核心思想是建立多個不同的決策樹模型組合成“森林”,通過每一棵“樹”對數據的分類進行投票決策[13],得票最多的類別作為最后的輸出結果。建立不同決策樹,通過對訓練集進行重采樣,得到多個子訓練集,每一個子訓練集對應生成一個“樹”。
利用診斷指標對上述3類不同基分類器的不同模型進行性能評價,在多個模型中選擇1個表現優異的故障遷移診斷模型,對該高性能診斷模型內的基分類器參數進行網格尋優,使模型達到最佳診斷狀態,再將測試數據集輸入該診斷模型進行故障診斷,得到最優結果。
掌握設備運行狀態是空調系統節能的前提[14]。故障數據來源于美國供暖、制冷和空調工程師學會與普渡大學合作的1個故障模擬項目[15]。該項目采用1臺316 kW(90 rt)的離心式冷水機組,在27個不同工況下,對離心式冷水機組的正常運行及7類典型故障進行測試。診斷類別如表1所示,包括:冷凝器水流量降低、蒸發器水流量降低、制冷劑泄漏/不足)、冷凝器結垢、制冷劑中含不凝性氣體、制冷劑過量、潤滑油過量。其中:制冷劑泄漏/不足、制冷劑過量和潤滑油過量3種故障隨著循環直接影響到冷水機組各個部分的運行情況,稱為全局故障;剩余故障均發生在冷水機組局部(不凝性氣體主要聚集在冷凝器中),稱為局部故障。

表1 冷水機組診斷類別
所得數據集包含64個特征參數,其中有48個特征參數通過傳感器直接測量獲得,另外16個特征參數通過計算獲得。故障診斷數據隨機提取,確保模型具有一定客觀性和魯棒性。
從27個工況中選取如表2所示的2個工況進行遷移診斷研究,對源域、目標域數據集下的有標記故障數據進行訓練學習。其中工況a為源域數據集(源工況),工況b為目標域數據集(目標工況)。a、b 2個工況下各提取3 000組數據,均包括200組正常運行數據和2 800組故障數據(每類故障400組)。設置工況b中只有隨機選取的20組數據是故障類型已知的,即有標記數據,其余2 980組均為測試數據。表3顯示了常規故障診斷與基于TAB算法的故障診斷調用數據集的區別[16],體現了遷移診斷的思想,即把工況a 8個類別(正常和7類典型故障)的信息遷移到工況b中,用于診斷工況b下機組的各類故障。

表2 遷移工況熱力參數

表3 不同方法調用的數據集的區別
在故障檢測與診斷中,可以根據實際類別、診斷類別(見表4)進行數據評價,表5給出了采用的評價指標及含義,分別為精確率、召回率、F1值及正確率。

表4 數據混淆矩陣

表5 評價指標介紹
由于所采用的數據具有64個特征,其中可能存在與遷移學習任務無關的特征,因而對數據進行多重處理,以得到具有適量特征、適合本次遷移學習任務的數據。特征工程可以最大限度地從原始數據中提取特征以供模型使用。將訓練數據集進行轉化,從而更好地向遷移學習模型描述潛在問題,提高遷移學習模型對目標未知數據診斷的準確性。


圖3 多重數據處理過程
(9)
(10)
(11)
采用無處理、方差選擇、標準化、歸一化和多重數據處理方法分別對TAB_AB、TAB_RCV、TAB_RF 3種遷移后的模型進行性能分析,正確率如圖4所示。可見,多重數據處理對于TAB_AB、TAB_RF 2種模型采用的是非線性的分類算法,輔助優化效果明顯,說明多重數據處理方法對于具有較強復雜問題識別能力的模型具有輔助優化效果。此外,該方法優于其他數據預處理方法,相比于無處理時診斷正確率分別提高了9.61%、1.95%。對于TAB_RF模型,增益效果不如TAB_AB模型明顯,說明多重數據處理方法對于性能一般的復雜模型增強效果更好。而對于TAB_RCV模型,其本質為線性回歸、學習能力有限的模型,多重數據處理方法的輔助優化效果無法體現,甚至表現為削弱效果,因此,對于該類模型應盡可能保留數據原始信息。所討論的遷移診斷性能分析均采用多重數據處理的方法進行操作。



圖4 不同模型不同數據預處理時的性能對比
基于3種基分類器構建的診斷模型的正確率如圖5所示,通過對比新工況下未采用遷移診斷和采用遷移診斷的結果,可以直觀地表明TAB算法對冷水機組新工況數據有限時提升故障診斷性能的有效性,其中,基于RF基分類器的模型提升性能最為明顯。

圖5 不同模型正確率
1) AB模型與TAB_AB模型的診斷性能對比。工況遷移前(僅采用目標工況的20組數據訓練),AB模型正確率為51.58%;學習源工況3 000組數據中的信息,進行遷移診斷后,正確率為62.93%,提升跨度為11.35%,即相比于未經過遷移學習的模型,正確率提高了22.00%。遷移前后的混淆矩陣及評價指標對比分別如圖6、7所示。工況遷移前,AB模型能夠實現對制冷劑泄漏、冷凝器結垢、冷凝器水流量不足和制冷劑含不凝性氣體4種故障的診斷,對于正常運行及其他故障均存在半數以上的診斷錯誤。從圖7可以看出,遷移后模型對局部故障的F1值整體上升,但對全局故障的F1值整體下降,且通過圖6可以看出正常運行與全局故障均診斷為制冷劑過量故障。可見,經過遷移學習后,TAB_AB模型對于局部故障能夠實現精確診斷,但放棄了更為復雜的全局故障診斷能力。


圖6 基于AB模型遷移前后混淆矩陣對比

圖7 AB模型與TAB_AB模型評價指標對比
2) RCV模型與TAB_RCV模型的診斷性能對比。工況遷移前后正確率分別為75.15%和77.03%,提升跨度為1.88%,較遷移前提高了2.50%。遷移前后的混淆矩陣及評價指標對比分別如圖8、9所示。工況遷移前,RCV模型能夠實現一定程度上的冷水機組故障診斷。工況遷移后,從混淆矩陣主對角線上的值可以看出,除正常運行與制冷劑泄漏和制冷劑過量2種故障外,對于其他故障正確診斷樣本均增多。從圖9可以看出,除制冷劑含不凝性氣體故障外,其余局部故障的F1值均得到提升,但正常運行與全局故障的整體F1值均降低。在遷移學習前,特別是制冷劑過量這種全局故障,存在著明顯的漏警現象,經過工況遷移后,可以看出整體漏警現象得到解決,但是對于正常運行的正確診斷數量減少,F1值下降。


圖8 基于RCV模型遷移前后混淆矩陣對比

圖9 RCV模型與TAB_RCV模型評價指標對比
3)RF模型與TAB_RF模型的診斷性能對比。工況遷移前后正確率分別為69.81%和92.38%,提升跨度為22.57%,較遷移前提高了32.33%。遷移前后的混淆矩陣及評價指標對比分別如圖10、11所示。在進行工況遷移前,RF模型診斷中整體漏警現象明顯,將大量實際故障數據診斷為正常運行數據,且整體診斷性能一般。工況遷移后的TAB_RF模型,從源工況數據集獲得足夠的目標工況知識,對全局故障能實現較優的診斷。由圖10可見,整體漏警現象得到優化,對于冷凝器結垢、冷凝器水流量不足、蒸發器水流量不足和潤滑油過量的4種故障不再出現漏警現象。從圖11可見,正常運行和各類故障的F1值均得到大幅度提升,且4種局部故障的F1值均達到100%,實現了精確診斷。


圖10 基于RF模型遷移前后混淆矩陣對比

圖11 RF模型與TAB_RF模型評價指標對比
以每個類別樣本數量占所有類別樣本總數的比例作為權重,將各模型各類別不同診斷指標進行加權平均,結果如圖12所示。各模型加權精確率、加權召回率、加權F1值和總體正確率均得到了一定程度的優化,表明TAB算法通過利用源工況數據的知識能夠有效幫助模型從不同方面提升性能,實現性能更佳的制冷系統目標工況故障診斷。遷移前,RF模型并不是診斷中的最優模型,遷移后,TAB_RF的各診斷指標均為最大值,表明TAB_RF模型是最適合遷移學習且診斷效果最佳的模型,因此,對該模型進行參數尋優,嘗試進一步優化模型的診斷性能。

圖12 不同模型對比
調整模型復雜度在故障診斷研究中有其重要性[18]。由于采用的RF基分類器為默認參數設置,從模型復雜度考慮,TAB_RF模型性能仍有提升空間。為此,對RF基分類器參數進行尋優。影響RF基分類器的參數分別為:最大迭代次數、樹最大深度、拆分內部節點所需的最小樣本數和葉節點所需的最小樣本數。采用網格搜索方式進行尋優,尋優范圍及結果見表6。

表6 參數尋優結果
參數尋優后模型記為TAB_RFop,對冷水機組故障測試集進行診斷,并與參數尋優前的TAB_RF模型進行對比分析。TAB_RFop正確率達到95.30%,提升跨度為2.92%。混淆矩陣及評價指標對比分別如圖13、14所示。


圖13 參數尋優前后混淆矩陣對比


圖14 TAB_RF模型與TAB_RFop模型評價指標對比
如圖13所示,尋優前,TAB_RF模型將大量正常運行數據虛警為制冷劑泄漏故障數據,導致正確診斷正常運行的數據數量少,經過尋優后,該現象得到大幅度優化,正常運行的正確診斷數據增加。此外,從圖14可以看出,經過參數尋優后的TAB_RFop模型的整體診斷性能上升,除制冷劑含不凝性氣體故障的F1值降低0.13%外,正常運行和其他故障的F1值均得到不同程度的提升,其中正常運行與制冷劑泄漏故障的F1值顯著提升,正常運行的F1值由60.49%提升至83.72%,制冷劑泄漏的F1值由77.97%提升至85.49%。
冷水機組的運行工況復雜,需要在不同工況下驗證遷移診斷對冷水機組故障診斷的有效性,因而增補目標工況c、d(見表7),并對比分析遷移診斷和常規(無遷移)診斷在單模式和全模式下的性能,各模式的訓練及測試數據集見表8。其中,工況c的蒸發器出水溫度與工況a相同,工況d的冷凝器進水溫度與工況a相同,單模式與全模式診斷的主要區別在于訓練數據采用單個工況抑或全部工況。例如:遷移診斷是前述利用了源工況信息改善目標工況診斷性能的診斷模型,其訓練集包含源工況數據,如果是單模式,則訓練集為源工況數據加單個目標工況數據,如果是全模式,則訓練集為源工況加3個目標工況數據的合集,測試集為某個目標工況;常規診斷是不利用源工況信息、僅用少量目標工況數據進行模型訓練的常規故障診斷,測試集與遷移診斷相同。

表7 增補目標工況熱力參數

表8 不同模式調用數據集區別
遷移診斷采用TAB_RF模型,常規診斷采用RF模型,工況a數據為源工況,工況b、c、d為目標工況,不考慮參數尋優時不同模式的診斷性能如圖15所示。可見,不論單模式或全模式,遷移診斷均較常規診斷性能有所提升,單模式的提升尤為顯著,對目標工況b、c、d的故障診斷正確率分別提高了22.43%、18.39%、20.77%,表明數據種類不夠豐富且數量較少時,更加需要利用遷移診斷學習源工況中的信息以提升診斷性能。全模式遷移診斷較常規診斷性能提升范圍為1.21%~2.55%,幅度較小,因全模式中模型學習到的知識相對單模式更為豐富,常規診斷性能已較單模式有顯著提升(21.66%~26.37%),即便如此,遷移診斷仍舊可以進一步提升其性能。

圖15 不同模式正確率對比
此外,從圖15還可見,參數尋優對于單模式下的遷移診斷模型具有輔助提升效果,正確率提升了3.06%,而全模式下遷移診斷模型的正確率卻降低了4.23%。觀察其訓練正確率高達99.68%,表明在訓練集的工況較多時,參數優化易使模型過擬合,太過嚴苛的模型參數不利于模型由訓練集到測試集的泛化。
基于源工況知識與目標工況少量數據建立遷移模型是解決冷水機組新工況數據缺乏問題的有效途徑,多個工況數據訓練的遷移模型可以比單模式獲得更好的診斷性能,在有多個工況故障數據時優先考慮全模式,不需要參數優化;只有1個源工況故障數據時,遷移診斷對目標工況(少量數據)的故障診斷性能有顯著提升,參數優化可以進一步提升其性能。
與傳統故障診斷不同,本文針對冷水機組工況復雜、獲得故障數據成本高導致故障診斷模型泛化性能差的問題,就冷水機組不同工況下的正常運行及故障數據,設計了1種基于不同基分類器的TAB遷移診斷模型,實現了新工況下故障的有效診斷。對于冷水機組包含正常運行和7類故障共8個類別在內的數據,源工況訓練樣本3 000組,目標工況(新工況)訓練樣本僅20組,通過遷移源工況中的故障信息,對新工況2 980組測試數據進行了故障診斷,得到以下結論。
1) 對原始穩態數據依次進行方差選擇、分布調整、進一步擠壓數據空間的多重數據處理是有效的,可以通過空間擠壓縮小不同數據集之間的差異,增加相似度,改善遷移診斷性能。該多重數據處理方法適用于不同工況或不同對象間遷移診斷時具有較強復雜問題識別能力的模型。
2) 通過對比新工況下未采用遷移診斷和采用遷移診斷的結果,驗證了TAB算法對于冷水機組故障診斷性能的提升效果。其中,TAB_AB、TAB_RCV 及TAB_RF診斷模型總體正確率的提升跨度分別為11.35%、1.88%、22.57%,分別達到了62.93%、77.03%、92.38%,TAB_RF的性能提升最顯著,局部故障F1值均達到100%。
3) 對TAB_RF診斷模型進行參數尋優可以進一步提升冷水機組的故障診斷性能。相較于未經參數尋優的模型,總體正確率提升了2.92%,達到了95.30%,且提升了制冷系統故障診斷性能:優化了正常運行虛警為制冷劑泄漏故障的現象,正常運行與制冷劑泄漏故障的F1值分別提升了23.23%、7.52%,對整體故障的診斷性能進一步提升。
4) 增補了工況c、d數據,對比分析了單模式與全模式下,冷水機組故障遷移診斷與常規診斷的性能。單模式下遷移診斷較常規診斷正確率提升顯著(18.39%~22.43%),全模式下提升幅度為1.21%~2.55%。遷移診斷能有效解決冷水機組新工況數據缺乏問題,在有多個工況故障數據時推薦采用全模式,且不用進行參數優化以免出現過擬合,可以獲得更優的診斷性能。
總之,新工況下的故障數據較為缺乏時,利用多重數據處理及TAB算法,結合不同基分類器,特別是RF基分類器,通過學習并遷移舊工況數據中的信息,實現對新工況故障的有效診斷,是冷水機組故障診斷的新出路,在提升診斷性能的同時,可以縮減實驗成本。