俞建明
(中核運維技術有限公司,浙江 杭州 311215)
設備冷卻水泵是電站中的重要泵類設備,它的作用是將核島相關系統和設備產生的運行發熱傳遞到廠用水系統,并最終釋放到自然熱阱(海水),從而保證這些被保護設備的可靠運行。在設計中,設備冷卻水泵設計為兩列并行,平時為一用一備運行,在特定條件下,需要兩臺泵同時運行以增加設備冷卻水流量,如圖1 所示。

圖1 設備冷卻水系統
設備冷卻水泵設計為臥式單級離心泵。兩臺泵布置于同一房間,成直線布置,廠房內從東到西依此為泵01B、電機01B,泵01A、電機01A。
原有水泵雖已有多種參數的監測,但是仍存在一些不足:(1)監測方案不足,如對故障診斷有重要意義的振動監測沒有進行監測;(2)監測參數沒有進行融合監測,每個參數都是獨立監測,數據之間沒有融合;(3)沒有建立故障診斷的規則庫,不能為工程師診斷故障提供輔助決策;(4)人工監測將引入其他風險,如區域狹小帶來的誤碰風險、高處作業風險和高溫作業風險等。
為了解決原有監測存在的不足,提升設備監測的效果,在審查設備冷卻水泵的監測方案時,對設備冷卻水泵的失效模式進行了分析,并根據先進模式識別方法對監測要求進行了升級。
基于初始設計要求,設備制造商為設備冷卻水泵配置了以下的監測條件,包括泵入口壓力、出口壓力、泵入口母管溫度、泵出口母管溫度、泵出口母管流量等參數,如表1 所示。

表1 現有系統測點清單
根據先進模式識別,對泵的失效模式進行分析整理,可以發現主要的可監測征兆點有入口壓力、入口溫度、入口流量、出口壓力、出口溫度、出口流量、驅動端三向振動、非驅動端三向診斷、驅動端位移、非驅動端位移、驅動端軸承溫度、非驅動端軸承溫度、推力軸承位移、推力軸承溫度等。對于單級離心泵的最有價值的監測參數如圖2,包括軸承部位的三向振動、軸承的溫度等參數。

圖2 離心泵監測參數價值分析圖
對以上離心泵的監測點和監測價值分析進行整理,得到如表2,表中簡要列出了泵的主要失效位置、降級機理、可監測的手段如振動、熱成像、溫度及油液分析。

表2 泵故障特征及監測分析
如表2 所示可知,作為轉機設備的泵,其最主要的失效問題還在于葉輪不平衡或磨損、密封泄漏、底座松動、泵軸彎曲變形、軸承磨損等問題。而目前可采用的監測方法主要包括振動測量、熱成像、溫度監測、油液分析等方法。
而根據圖3 所示轉機設備的故障發展過程來看,在故障初期第1 階段,超聲特征會有所改變,但此時的缺陷征兆不容易被識別且故障程度也無須進行修正;到故障早期的第2 階段,振動特征已經開始改變,根據現有監測手段已經比較容易進行信號捕捉,而且此時已經需要采取一定的措施對故障缺陷進行糾正;到故障發展的第3 階段,轉動部件的磨損已經發生并且對潤滑油的品質產生了影響,部分磨損顆粒也已經產生并可分析確認;到第4 階段,由于潤滑和冷卻的不良,會導致軸承等部位的溫度升高;到第5 階段,隨著磨損的繼續發展,已經可以發現較為明顯的噪音;到第6 階段,軸承等部位的溫度會隨著摩擦效果而急劇上升;最終造成轉動設備的故障發生。

圖3 轉動設備故障發展圖
從以上分析可以得到,振動、溫度、油液分析對轉機設備的故障程度的認知是比較可靠的。在本例中,由于設備冷卻水泵的潤滑油液的量相對較少,而實現在線油液分析的變更難度較大,且泵的潤滑油更換較易實施,并且在潤滑油更換時也可以進行油液的分析而不需要增加在線的分析,因此,主要考慮對泵本體增加振動、溫度的監測。
根據2.1 節的分析,結合設備已有的監測手段,對設備冷卻水泵的監測方案的總結如表3。

表3 推薦臥式-單級離心泵監測參量
從表3 中結論可看到,新方案對泵的監測主要是新增了三向振動傳感器和軸承溫度傳感器。選用的是振動溫度一體的無線探頭,布置點為電機的非驅動端、驅動端、泵的驅動端、非驅動端四個位置共12 個無線探頭,這些無線在線監測探頭解決了現場操作人員的誤碰風險和高溫作業風險。
智能監測系統對泵增加了額外的監測參數以后,要實現新增監測數據的采集并和電站已有DCS 數據之間的融合。另外,還需實現異常自判斷、趨勢分析、故障診斷、自動健康報告、報警信息推送等功能。它以一種在線監督和信息推送的方式向工程師報告設備的運行狀態,從而為工程師的決策提供準確的支撐數據。如圖4 即為泵的振動參數測量實測值和特征趨勢圖,可以非常直觀地為工程師提供泵的振動發展趨勢。

圖4 泵非驅動端的振動實測值與特征趨勢圖
為泵增加智能監測,主要的特點體現在智能診斷。因工業大數據區別于商業大數據的特點,商業大數據主要集中于判斷各類數據之間的相關性,而工業大數據不僅僅需要建設這種相關性,而且需要將之與設備的運行機理和失效模式相結合,從而為工程師決策提供依據,因此,為泵類設備設計智能診斷還需要進一步的工業運行機理的研究。本節主要就是介紹泵類設備的失效征兆與故障結論研究、故障規則庫的建設、故障案例庫的建設、和故障自動診斷的實現。
為了構建一個更好的泵類設備智能監測及診斷系統,需要對設備的故障方式進行全面的分析,首先,要研究征兆規則和故障結論,征兆規則包括故障征兆發生的部位、征兆的對象、征兆的變動屬性等;故障結論包括故障發生的部位、故障的具體類型、故障的原因、故障的結論、應該采取的解決措施等,如表4。

表4 故障規則分析表
在對設備進行失效分析后,將故障的結論和故障的征兆進行融合,形成設備的故障規則庫,表4 是泵類設備葉輪不平衡、泵軸承損傷兩個故障規則的案例,對泵進行全面的故障分析后形成泵的故障規則庫。故障規則庫的構建需要綜合科研機構、制造廠商、行業應用實踐等綜合信息進行構建,而且是需要不斷更新完善的,圖5 是故障征兆、故障結論、故障規則和故障案例之間關系。

圖5 故障征兆、故障結論、故障規則和案例庫
故障的自動診斷和結論推理排序是一個相對復雜的過程,但是,對電站工作實際又有較高的指導意義。它既要考慮故障與征兆之間的邏輯關系,又要考慮故障結論與征兆之間的依存度,還要考慮本電站設備發生故障的實際情況。因此,建立一個相對較為科學的故障診斷排序方法是比較困難的,也要更多地依賴電站工程師的知識和經驗。
在對設備的失效方式進行分析的過程中,發現每類故障都會有多個故障征兆相伴隨。而單個故障征兆又可能指向不同的故障。根據條件概率的計算方式,我們將故障概率定義為Pi(B),將故障征兆定義為Pj(A)。
式中,P(B):在某一征兆出現的情況下,特定故障的概率;P(Ai):故障對應的每個征兆出現的概率;從故障機理來說,故障發生時,一般與之關聯的征兆都會出現,而單一征兆出現時,故障的置信度則需進行平衡化分配,初次設置一般將征兆出現的可能性置為1/n;P(B/Ai):在征兆Ai出現的情況下,發生故障的可能性,也即是上文表4 中所示的關聯度系數。
表5 即為某次泵驅動端振動速度有效值超閾值上限后推理出的故障結論表。之所以有這么多的推理結果,是因為該征兆是一個較為廣譜的征兆,它與多個故障結論有關聯,而且在每個故障結論的征兆群里的重要程度并不相同。

表5 故障規則推理匹配表
2023 年3 月22 日,智能監測系統在線振動傳感器測到2 號機設備冷卻水泵B(2-CCS-MP-01B)測點P1V振動6.3mm/s,觸發系統報警,如圖6,振動測試人員到現場使用手持振動檢測儀復測核實振動超標。

圖6 設備冷卻水泵振動超標圖
使用故障自診斷系統進行故障推測,部分推測結果如表5。
從表5 推理結論來看,導致本次振動有效值超標的可能結論很多,而且各故障的可能性與3.3 節所描述的故障征兆與故障結論的關聯度設計有關。本次故障報警后,電站對泵進行了解體檢查和維修,發現:泵驅動端和非驅動端軸承外圈內側均存在缺陷,葉輪動平衡也不合格。后對軸承進行了更換,對葉輪進行了打磨修復和動平衡試驗,回裝后復測振動合格。
經過對此次事件進行根本原因分析,主要的經驗為:由于系統內兩臺泵布置關系,電機01A—泵01A—電機01B—泵01B 在一條直線上,在01A 泵運行期間,01B 泵停運,01A 泵的振動通過樓板/管道傳遞給01B,導致01B 泵的軸在軸承內出現小幅振動,從而出現磨損現象。設備在正常運行期間,軸承內接觸面間,本可以建立油膜,起到降低磨損的作用;但是,在微動磨損的情況下,難以建立起油膜,因此磨損情況會加劇產生。
從本次故障推理的情況來看,葉輪不平衡和軸承磨損都在故障規則的推理范圍內,但是,因為這種由于泵的微振而導致軸承損壞的概率不高,因此其推理結果的排名并不靠前;而葉輪不平衡的問題也因為一般泵設備在安裝前都會在廠家進行動平衡試驗而概率較小。但是,這個故障畢竟發生了,并且本次事件故障結論已確定為軸承損壞和葉輪不平衡,所以有必要將案例進行錄入并在下次出現同類型征兆診斷時考慮。在將故障轉化為本設備的故障案例后,再重新進行振動超標的故障診斷測試,發現診斷結論為軸承損壞的匹配度上升。也就是說,只要有足夠多的故障案例,智能系統的故障診斷結論會越來越接近于設備的實際情況。
智能監測系統已運行一段時間,已在以下四個方面發揮了作用:(1)幫助工程師多次提前發現設備故障征兆,經過及時的分析應對,避免了設備的非預期故障失效。(2)新增加的振動在線監測,完全替代了原來的人工離線振動分析,減少了現場高溫高噪音等惡劣環境下的工作量。(3)通過多源狀態參數的自動監測,替代了原來由工程師進行的參數監測與趨勢分析,減輕了工程師的工作強度。(4)通過綜合健康監測分析設備健康狀態,已將設備冷卻水泵的解體大修由原來的基于時間的定期維修轉為基于狀態的解體維修,進一步增加了可靠性和經濟性。
綜上,為泵類設備增加智能監測是一個非常有價值的前瞻性的工作,值得在行業內進行推廣。