韋濤 宋力
(中海油能源發展采油服務公司,天津塘沽,郵編:300452)
RCA(Root Cause Analysis)工具,即根本原因分析工具,是一種找出和消除重復導致事故事件發生的根本原因的工具。現今RCA工具在整合事件資源、人力資源,運用固定的分析流程得出處理方案,以最終達到消除事故事件的直接原因、根本原因和系統原因表現出突出的先進性。在燃氣透平發電機組維保體系中,將RCA工具建立在以已有設備故障現象數據的前提下展開針對該故障的地毯式誘因普查,在給處理故障指出一個明確的方案的同時,也為機組隱患排查和零部件及系統性能有了一個直觀的認識與掌握,將會對現有燃氣輪機的維保體系起到一個很好的補充與優化的作用。
根據美國能源部1992年發布的《根本原因分析指南》中,把根本原因定義為:指一種原因,當這種原因被糾正以后,將會防止此類事故或者類似事故的再次發生。PII公司對RCA定義為:通過一整套系統化、邏輯化、客觀化和規范化的分析方法,找出設備故障的機理和根本原因,并通過制定合理的糾正措施徹底消除這些根本原因,從而恢復設備的功能,防止同樣或類似故障重復發生的一種解決設備故障問題的分析方法。
RCA在設備管理方面的實施過程基本上包括以下幾個部分:
在設備維保管理中,當設備出現失效或者異常情況時,需要立即展開RCA數據收集,收集的數據包括設備故障前、故障發生時、以及故障發生后的基本運行參數、現場零部件表面情況、設備運轉環境因素、操作人員操作過程以及其他一些同事故發生的有關因素。
在事故原因分析過程中,通常采用因果分析圖法。因果分析圖遵循追溯原則,同時包含三要素,即最近端直接原因、證據、解決方法(如圖一)。
在做設備故障失效RCA過程中,需要管理團隊各個職責人員的參與,組成RCA團隊。團隊成員應包括設備管理部門主要負責人作為RCA組長(負責協調設備維保各個部門成員的合作與安排)、參與設備故障處理的專業技術人員、設備所屬操作人員等。

根據分析完因果分析圖,檢索出故障處理的解決辦法和需要各個部門完成的工作,列出工作布置表。各個部門根據部署表的內容和時間要求進行故障現象的確認和解決,將確認和解決的結果記錄在部署表內。當找到事故的根本原因并做處理措施后,要對處理措施做評估,確保該措施能夠徹底解決類似事故,防止類似事故的再次發生。

表一 RCA解決方案部署表
當設備故障處理完畢后,針對RCA數據進行引申應用。包括將類似事故的所有原因的解決方法與系統原有設備維保工作的項目對比,找出系統中不全面、不精確或者錯誤的維保內容,加以糾正與補充。針對設備故障的根本原因是設備零部件故障或原設計不合理的情況,只要有充分的證據和前例,可以以RCA數據作為依據進行設備系統改革創新。
據了解,在大多燃氣透平發電機的維保體系中廣泛使用的是預防性維修PM (Preventive Maintenance)和簡單的預知性維修PcM(Predictive Maintenance)相結合的維修體系。
預防性維修的特點是為了降低零部件或系統失效概率或防止功能退化,按照預定的時間和標準實施的強制維修和檢查。采油設施設備管理部門根據燃氣輪機廠家給出的參考資料和設備使用要求,制定了包括 800h、2000h、4000h、8000h PM 工單,結合計算機軟件(如MAXIMO管理軟件)形成了燃氣透平發電機的預防性維修管理制度。該制度通過多年的實踐證明,對燃氣輪機的穩定運行和機組壽命起到了重要作用。但是,PM制度也存在明顯的不利方面:
(1)以時間為基準的強制行維修或僅有的強制檢查勢必造成過度維修或過少維修。
(2)設備投產初期PM制度不適用于已經運轉多年時間的老設備和老系統。
(3)PM制度中的工單內容制定是以廠家標準工況為基礎的,但設備所處工況包括環境因素、負載輕重情況、燃料品質等都有所區別,如果一概只按照PM工單執行設備維保工作,可能會造成設備維保偏失。
輪機的預知性維修PcM是在對燃氣輪機運轉數據的監測基礎上進行的。燃氣輪機數據監測主要在以下幾個方面:
(1)操作人員點檢數據和運行數據的抄錄。人員在燃氣輪機橇內運行情況的檢查、橇外儀表數據抄錄和監控軟件。人員巡檢和數據記錄的目的是隨時觀察橇內外有無異常情況,掌握機組運轉數據有無明顯變化趨勢,這種以人的能動性為基礎設備數據監測有助于操作人員對機組運轉狀態的直接把握。
(2)監控軟件的數據監測系統。包括重要參數的歷史記錄和曲線分析、機組運轉綜合性能分析、機組壓氣機污染指數計算以及機組的報警關斷系統等。這些實時、充分的數據記錄給維保工作提供了直接的依據。
(3)機組滑油的油液分析。目前維保體系中規定了對機組的滑油每三個月取樣化驗以監測機組內部軸承和齒輪箱的磨損狀態等機組重要因素。
燃氣輪機的預知性維修是建立在數據的基礎上的,這就要求設備管理人員對數據的較高敏感度和對數據的勤于觀察。依靠預知性維修,我們可以確切的掌握機組的運轉狀態是否健康,同時可以根據數據決策需要做的檢修或保養。但是,預知性維修的盲區在于零部件本身質量的變化,因為局部的零部件失效造成機組故障無法在預防性維修中涉及到。
除了預防性維修和預知性維修外,海上燃氣輪機機組的故障在處理完后都以故障報告的形式給出。故障報告包含三個部分,故障描述、故障分析、解決方法,這幾個部分都是針對故障解決完后形成的直接報告,不涉及引起故障的其他可能原因和預防措施,同時其解決方法針對性強,往往治標不治本,造成故障的反復出現。
總體而言,目前的燃氣透平發電機維保體系較為全面涵蓋了機組的維保內容和性能監測。但在故障處理方面沒有給出明確的方法和策略,同時維保內容相對固定而不能因機組服役期延長等外界因素而改變,另外現有維保體系未涵蓋對長期使用的系統零部件的失效預期與檢查。
筆者所在渤海明珠號FPSO上配置有燃氣透平發電機4臺,其中兩臺ROLLS&ROYCE機組是早期建造FPSO期間配置,距今幾近20年,兩臺SOLAR機組與2003設施整體改造時新增發電機。近年來,幾臺主機動力部分多次達到預訂大修時間,也順利完成主機大修或交換機組項目。然而,伴隨機齡的增長,機組的輔助系統包括滑油系統、燃料系統等經過多年的使用,經常會出現意想不到故障,給電站穩定和日常生產生活造成一定的影響。
筆者所在渤海明珠號維修部門在引進RCA工具后,成功處理了多次機組疑難故障,同時在處理故障后針對RCA過程中的數據和分析內容,建立了一些新的檢查制度、針對特殊零部件失效情況提出了系統改進等,在故障處理過程中也對所屬系統零部件進行了徹底的檢查。在今年年初至今,渤海明珠號運用RCA工具,成功處理了機組喘振故障、起機速度爬坡失敗故障、機組滑油高溫故障、機組橇內火氣報警事故以及機組起機停滯等疑難故障。在此以SOLAR機組橇內火氣報警導致停機故障和R&R機組起機爬坡失敗故障為例,詳述RCA在燃氣輪機故障處理和管理中的實踐方式。
(1) 數據收集
3月1 3日,SOLAR D機經過維修各部門詳細檢查并恢復CO2氣瓶后,用燃油啟機試驗。在燃油方式下啟機后各參數無異常,切換到燃氣模式以觀察吹掃閥動作和柴油管線溫度。發現吹掃閥在主燃油關斷閥動作后開啟,約10S左右關閉(邏輯動作要求20S。)。在此過程中檢測柴油管線溫度,沒有發現溫度有明顯上升。為了再次確認,重復了切油再切氣的過程,同樣觀察到閥動作和溫度無異常。在觀察半小時后,SOLAR D機帶載供電。
設施操作人員在D機帶載后,每隔十分鐘對柴油管線溫度進行檢測,離噴嘴距離稍遠的位置開始溫度均為30~50℃左右,并在C機上測量同樣位置對比,溫度幾乎一致。加密觀察直到晚上21:00,確認無異常后,每隔2小時巡檢定點測量溫度。21:00后回復火氣系統自動狀態。
此過程持續到3月15日,仍無任何異常現象。3月16日上午8:15,為了停機檢查天然氣壓縮機,將三臺主機切換到燃油模式。9:30,燃油模式切換到燃氣模式,切換的過程中觀察吹掃閥動作和柴油管線溫度正常。此后每兩小時巡檢定點測量燃油管線溫度,直到下午17:00左右的巡檢無異常;
下午19:00設施操作人員照例打開撬門準備測量溫度時,發現柴油管線pigtail和燃油分配器(如圖二)部燒紅。

圖二 平發電機pigtail燃油分配器
(2)因果分析圖

圖三 因果關系圖局部視圖
根據事故的數據分析,海上維修團隊討論的結果,做出如圖三因果關系分析圖,原因鎖定在以下幾個方面,包括燃油吹掃閥泄漏或吹掃時間過長、主燃料管線上的單向閥破損泄漏、PCD反竄或循環、燃油分配塊有缺陷等幾個問題上。
(3)解決方案部署表
以下是針對以上四個原因的檢查方案部署表和完成情況。(總體RCA部署表更全面,此處以四個方面為簡例)
部門檢查發現,燃油分配塊在燃料分支管線上有非常細小的裂紋缺陷(如圖四),同時比較新舊型號燃油分配塊,發現型號差異表現在燃油分支館內的阻尼孔差異,新型號滑油分配塊有阻尼孔用于阻止噴嘴間的高溫氣體竄流。

圖四 燃油分配器
(4)RCA分析結果引申
本次RCA找出了故障的根本原因和解決方法,在整改過程中,RCA的收獲不僅僅是處理了故障,通過RCA中的各種原因分析和檢查情況,我們大致可以得出以下需要關注和改進的地方:
1)橇內由于燃料管線或閥門等部件的外漏碰上高溫表面是可能造成機組橇內失火的潛在隱患。所以需要制定針對燃燒類設備定期的火災隱患排查,包括對管線表面缺陷、接頭是否松動、管線震動磨損情況以及火氣系統等的檢查和確認。由此RCA,我們建立了全船燃燒類設備的火災隱患專項檢查制度。

表二 檢查方案部署表
2)老型號燃油分配閥的內在設計問題是造成此次事故的一個重要原因。而我們的設備管理中卻沒能及時更近廠家的服務公告,及時更換新型號燃油分配塊。由此,我們在今后的工作中要及時與服務商溝通,了解最新服務公告等信息。
在RCA過程中,我們對相關零部件進行了檢查,發現了一些平時沒有機會發現的隱患。例如在檢查主油路上的單向閥時,發現單向閥內O型密封圈已經缺失四分之一,無法起到密封作用,失去了其設計功效。但在此次RCA前幾組仍然在此隱患下運行,只是還沒因此發生故障而已。由此,我們體會到針對輔助系統的一些長期服役的部件,我們需要做定期檢查或者更換。
(1)數據和信息收集
雙羅機組在發生火氣報警后,在高速帶載情況下停機。操作人員將火氣報警復位后啟動機組,發動機點火正常,發動機轉速從2200rpm開始上升到5600rpm,報警停機。報警描述為:TURBINE STAGNATION。
檢查此報警條件為:監測透平啟動過程中,判斷連續3秒內,發動機每秒轉速上升小于40轉。判斷為加速過程中燃料和氣路供應問題。現場對燃油管線上的濾器進行檢查更換,包括橇外雙聯濾器,橇內Y型濾器,燃油泵出口高壓濾器。清潔燃料氣濾網。再次啟動機組,觀察bleed valve狀態。機組在啟動加速到5600附近,同樣的報警停機。Bleed valve有空氣排出,因轉速低排氣量很小。在排除燃料系統濾器等節流問題后,進行RCA分析全面排查。
(2)RCA因果分析圖
通過維修團隊集思廣益,采用頭腦風暴的形式對機組故障可能原因進行分析,列出因果分析圖如下:

圖五 因果分析圖局部圖
(3)RCA措施部署和結果

圖六 燃料系統圖
在RCA過程中,基本排除高溫超速和機組轉阻大兩個大方向的原因后,我們將問題鎖定在機組動力不足的角度。根據前期機組保養和故障排查工作,我們將問題重點集中到如下幾個重點排查方面,一下是排查點和排查結果:(附燃料系統圖)

表三 排查結果表
(4)RCA引申
1)在此次故障處理RCA過程中,我們檢查了包括燃油系統、燃氣系統、儀表氣系統,這些系統都是導致機組爬坡故障的可能因素。在此檢查過程中,我們對這些系統的有了更加深入的了解和狀態的掌握。
2)在最終根本原因的分析發現,速度感應閥是一個容易損壞的機械傳動部件,容易造成機組無法運轉,參與討論的人員認為有必要對這種機械感應防喘方式做一個改革創新,即該造為以采集速度信號和電磁閥控制模式的防喘方式。
結合以上對海上現有燃氣輪機的維保體系現狀的介紹和兩個RCA運用案例的分析,我們可以發現,RCA工具是建立在以已有設備故障現象數據的前提下展開針對該故障的地毯式誘因普查,在給處理故障指出一個明確的方案的同時,也為機組隱患排查和零部件及系統性能有了一個直觀的認識與掌握,總體而言,RCA工具的應用是對現有燃氣輪機的維保體系起到一個補充與優化的作用。具體模型如下:

5.1 該模型對P M體系的優化與補充
RCA過程以現有設備狀態為基礎對設備可靠性做出分析,給出措施和意見,這些措施中就包括建立以時間為基礎的新的定期工作項目或者RCA發現已有PM工單時間間隔和工作項目不適合的情況,根據新的RCA結果,我們可以對已有PM工單進行改進,也即對PM體系的一個優化的過程。
1)PdM預知性維修體系是建立在現有監測數據的基礎上展開對機組性能和機組零部件可靠性的未來預期和維修保養。簡言之,預知性維修是對未發生的事情提前做出故障判斷和處理。RCA過程中,我們將已經發生的故障做出詳細分析,這些故障分析案例將為PdM預知性維修體系提供更加真實可靠的數據,豐富了預知體系中的的內容和方向。
2)RCA過程中,不僅僅處理了故障,也利用這個機會進一步大面積的對某個系統進行了檢查和確認,得出的結果可以作為機組性能和狀態預測的基礎,即RCA過程給PdM提供了機組某系統現狀數據信息,豐富了預知性維修數據庫,也某些系統預知性的盲區。
1)RCA過程中,涉及的原因多種多樣,包括系統性的原因,例如人員管理、崗位職責明晰、現有備件管理制度等。在RCA過程中,對不合適的人員管理理念和設備管理理念做出分析和判斷,有助于我們對不合時宜的理念和制度做出改變。
2)RCA的結果暴露出系統的設計缺陷或選型缺陷,如果要徹底改變故障的頻發,我們需要對系統進行優化創新。例如R&R機組的防喘控制信號采用的是機械傳動速度信號,速度感應閥容易出現故障導致機組趴窩,多次影響機組運行,由此我們可以在此對防喘系統做技術優化。所以RCA工具是設備優化創新的重要推動力。
3)團隊成員在參與RCA過程中,通過集體討論和辯論的形式詳細地了解了系統知識,提高了團隊成員的技術水平和維修團隊的整體實力。
【1】徐東明.RCA/CA:根源分析和糾正措施.科教文匯(下半月)2006年04期
【2】趙婉.可靠性工程師資格考試輔導教材之三——根源分析方法.質量與可靠性
【3】高立剛,呂群賢.設備失效根本原因分析技術和方法及其在廣東核電的應用[J].核科學與工程,2004,(24):2.
【4】劉義樂.RCA在設備管理中的應用.維修精粹
【5】李保文.設備管理創新與TnPM.中國機械工程學會TnPM推進中心