周 勇,朱鵬樹,陳 星,馬 波,杜曉光
(1.大亞灣核電運營管理有限責任公司,廣東 深圳 518031;2.北京化工大學,北京 100029;3.中廣核研究院有限公司 北京分公司,北京 100086)
核電廠依靠核反應堆將核能轉換為熱能,產生水蒸氣推動汽輪機發電。雖然其功能與火電廠相似,但核電廠的廠用電系統設計不同于火電廠,因為核電廠有核安全的要求,對廠用電系統的可靠性具有更高的要求。因此,在正常供電系統出現故障時,要求有多重備用電源,以保證達到核安全的要求。為此,核電廠每臺機組配備兩套應急柴油發電機組。為確保核電廠應急母線供電的可靠性,IEEE387-1994[1]規定應急柴油發電機組必須在10s 內啟動并建立額定電壓和額定頻率,所以核電廠應急柴油發電機組對于核安全至關重要,必須保證其設備的可靠性。

圖1 應急柴油發電機組系統組成圖Fig.1 Composition of the EDG system
核電站應急柴油發電機組系統非常復雜,根據IEEE387-1994 的規定,應急柴油發電機組由柴油機本體、發電機、機械輔助系統和電氣輔助系統等組成[2],如圖1所示。
應急柴油發電機組每月會進行定期試驗,但如果僅僅依靠試驗期間,技術人員的巡檢和就地儀表的顯示將無法對應急柴油發電機組的狀態進行評估,無法發現潛在故障。為此,在應急柴油發電機組上增加專用狀態監測系統,專用狀態監測系統的組成如圖2 所示。通過對檢測數據的異常檢測,來發現機組潛在故障。
應急柴油發電機組監測數據異常檢測常用的方法有3種:基于固定閾值的異常檢測方法、基于專家系統的異常檢測方法和基于數據驅動的異常檢測方法。監測系統的異常檢測流程如圖3 所示。
基于固定閾值的異常檢測方法是目前核電廠應急柴油發電機組普遍使用的異常檢測方法。應急柴油發電機組在定期試驗和大修再鑒定過程中,運維人員實時關注關鍵測點,或者采用錄波儀記錄關鍵測點的數據,將數據與廠家預設的閾值進行比較,例如氣缸溫度、柴油機轉速、勵磁電壓、電流、電壓頻率是否超出預設的上下限值,一旦超出此范圍,則發出警告。固定閾值只能對部分關鍵測點進行檢測,無法監測到所有關鍵測點。但固定閾值監測操作簡單、方便,無須借助專用分析軟件。

圖2 狀態監測系統組成圖Fig.2 Composition diagram of condition monitoring system
基于固定閾值的異常檢測方法存在以下問題:
1)應急柴油發電機組的狀態如果出現異常,比如在正常值上下波動,不會導致關鍵測點的值超過閾值。通過固定閾值的異常檢測方法,將無法發現很多類型的異常。
2)廠家出廠設定的閾值,用于對系統運行安全提供保障。如果出現超閾值情況,意味著某些部件已出現損害,應停機檢查,并更換相應的部件。因此,固定閾值的異常檢測無法發現設備故障早期的異常。

圖3 監測數據異常檢測流程Fig.3 The flow chart of anomaly detection for monitor data
基于專家系統的異常檢測方法在工業界有大量的應用,尤其是在航天和鐵路系統中[3]。專家系統基本上是基于規則進行異常檢測。這些規則是系統設計或運行過程中,專家通過經驗總結的,描述異常和征兆之間的關系。
該方法的優點是在于表現直觀、簡單,異常檢測速度快,專家診斷系統開發方便、快速,可以在很短時間內完成開發和部署。
該方法的缺點是由于應急柴油發電機組系統復雜,核心部件依賴進口,關鍵設備的運行或故障規則未知,要建立準確完備的規則非常困難。應急柴油發電機組日常處于熱備狀態,每月才執行一次試驗,為收集規則帶來挑戰。因此,基于專家系統的異常檢測方法無法處理未知異常。
基于數據驅動的異常檢測方法采用統計學分析技術、機器學習技術和信號處理技術,對監測數據進行建模和分析,識別異常數據?;跀祿寗拥谋O測數據異常檢測方法不依賴專家經驗,而僅根據監測數據特征進行異常發現。監測數據中包含時間戳,其異常類型與時間序列異常相似。
數據驅動的異常檢測方法可大致分為基于相似性、基于統計和基于偏差等3 種方法。
1)基于相似性的方法
計算待分析數據與基礎數據的相似度,將待分析數據按相似度進行劃分,與基礎數據相似性較低的數據被標定為異常數據。前提必須是基礎數據量要遠遠大于待分析數據,特別適合于工業設備的異常檢測,包括基于距離、基于聚類、基于密度等[4]。
優點在于只需要找到一個特征函數,就能描述基礎數據的分布,并且可根據該函數,使用相似性的方法檢測出異常的數據;缺點在于其對特征函數依賴度高,容易受噪聲影響。
2)基于統計的方法
使用統計學算法,計算待分析數據在數據集中出現的概率。該方法假設正常數據發生概率高,而異常數據發生概率低,分為參數方法和非參數方法。
優點在于可以利用統計和概率的理論知識,這些知識在工業和生產中有大量應用;缺點在于為了統計數據發生的概率,通常需要將數據進行離散化表示。對于高頻采樣的數據,例如應急柴油發電機組啟動過程中的數據,就無法應用該方法進行異常檢測。
3)基于偏差的方法
通過基礎數據建立數學模型,使用數學模型計算待分析數據與基礎數據之間的偏差,如果偏差較大,判定為異常數據。分為:基于預測、基于分類以及基于統計方法。
優點在于建立數學模型后,待分析數據的異常檢測效率高;缺點在于建立比較準確的數學模型難度較大。
基于數據驅動的異常檢測方法為監測數據異常檢測提供了方法基礎,但由于不同的監測對象,其監測數據的特征存在較大差異,必須具體問題具體分析,對不同的監測數據采用不同的異常檢測算法。因為沒有一個異常檢測方法,可以有效地檢測所有的異常類型。
由于核電廠應急柴油發電機組系統復雜,設備眾多,監測點多,專業性和相關性強,導致監測數據量非常大。目前核電廠運維過程中,應急柴油發電機組的潛在故障及異常的發現仍以人工巡查和閾值判斷為主。發現潛在故障后,主要依靠專家經驗進行分析。假設核電廠有4 臺機組,每臺機組配備兩套應急柴油發電機組,全廠配備一臺應急柴油發電機組,一共有9 套應急柴油發電機組。如果只靠人力和簡單閾值判斷,無法滿足設備運維的需求。隨著設備可靠性要求的逐漸提高和海量監測數據的收集,基于數據驅動的方法已經成為現在及未來監測數據異常檢測的重點。

表1 不同檢測方法的性能特點Table 1 Performance specialties of different detection methods
雖然基于數據驅動的監測數據異常檢測在工業界有大量應用,但是在應急柴油發電機組的各種類型異常檢測過程中,由于監測數據本身的特點,很多異常檢測算法在應用時需要優化和調整參數,才能更好地應用于監測數據異常檢測。
雖然應急柴油發電機組監測數據按采集時間戳進行存儲和分析,但由于應急柴油發電機組自身的復雜性以及核電站對其高可靠性的要求,該領域的研究還處于算法的嘗試階段。核電廠應急柴油發電機組安裝狀態監測系統可以使用大數據技術對監測數據進行存儲和分析,對監測數據進行異常檢測。監測數據具有測點多、種類復雜(振動測點、熱力學測點、工藝量測點、開關量測點等)、采樣率高(振動測點采樣率最高25.6k)等特點,使其成為工業大數據應用的典型場景。不同檢測方法的性能特點見表1。
由表1 可知,對比固定閾值和專家系統檢測方法,基于數據驅動的方法具備無需專家經驗、自動檢測能力強,實時性滿足現場需求等優點。但是數據驅動的異常檢測方法只能提供數據算法和數學模型,其在應急柴油發電機組的異常檢測應用方面仍存在缺陷。根據表1 所示,基于數據驅動的異常檢測方法存在以下缺陷:
1)應急柴油發電機組結構復雜,不同部件的工作模式差別很大,柴油機及輔助系統的關鍵測點之間關系復雜,使用純數據驅動方法的異常檢測,其誤檢率較高,無法滿足系統預測性維護需求。
2)如果將數據分析算法直接應用于監測數據的異常檢測,而忽略監測數據特性以及異常類型特點,將導致算法的適應性差,檢測結果可解釋性差,無法有效指導故障診斷以及維修。
因此,高可靠的應急柴油發電機組運行要求以及工業大數據的分析場景,需要開發專用的異常檢測方法對海量監測數據進行數據挖掘,以找出數據中的異常。所以,必須在充分理解應急柴油發電機組特性的基礎上,對不同測點采用不同的數學模型和分析策略,才能建立具有實用性的基于數據驅動的應急柴油發電機組監測數據異常檢測體系。
根據本文對核電廠應急柴油發電機組監測數據異常檢測方法的調研及分析,展望基于數據驅動的異常檢測可從以下3 個方面開展工作。
1)基于物理模型與數據驅動的融合方法研究
單純采用數據驅動的方法進行建模時,會忽略專家經驗以及柴油機物理特性信息,使得算法受訓練數據影響,造成誤檢率較高。因此,在評價不同數據驅動方法的訓練結果時,應借助于柴油機及輔助系統中關鍵部件的物理模型,將專業領域知識和數據驅動的方法進行融合。
2)結合監測數據特性分析的數據驅動建模方法研究
如果直接使用時間序列異常檢測方法對監測數據進行異常檢測,將會忽略監測數據本身的特征,造成算法的適應性差。因此,應結合監測數據自身的特征,如振動數據的時域/頻域變換,增強異常檢測算法的針對性,提高檢測率。
3)基于物理特性的監測數據異常檢測方法研究
基于數據驅動的方法的檢測結果的可解釋性差。因此,應結合應急柴油發電機組的物理特性和定期試驗特點,將專業知識融入監測數據的異常檢測中。通過物理特性與數據驅動方法結合,增強檢測結果的邏輯性以及可解釋性。
結合核電廠應急柴油發電機組監測數據的描述,論述了監測數據異常檢測的關鍵因素。有針對性地對監測數據的異常檢測方法、含義以及其應用現狀進行了描述,并結合工業大數據的特點,分析了基于數據驅動的監測數據異常檢測存在的不足,展望了未來基于數據驅動的異常檢測方法的發展。
通過對核電廠應急柴油發電機組監測數據異常檢測方法的調研和分析,建立應急柴油發電機組監測數據異常檢測的概念,將大數據分析和數據挖掘的思路和方法引入系統監測數據異常監測中。通過分析監測數據特性,挖掘監測數據內在價值,增強設備管理能力,降低維護成本。