錢 肖, 朱英偉, 劉 棟
(1.華北電力大學,北京 102206;2.金華電業局,浙江 金華 321017)
近年來,在電力系統一次設備全壽命管理方面,已開展了一系列研究工作,提出了規范化的指導原則和管理方法。但針對電力系統二次設備,尤其是計算機監控系統的使用壽命周期研究則并不多見。目前國內對監控系統壽命的判斷大部分依據主觀經驗,一般5~8年,多的10年,與國外使用壽命12~15年差距較大。由于缺乏科學化、系統化的對監控系統等二次設備全壽命周期管理的方法,導致很多監控系統未到使用壽命年限就進行了更換,造成投資的浪費。因此,有必要對計算機監控系統的使用壽命評估方法進行研究。
本文介紹了一種針對變電站計算機監控系統整體壽命進行評估的方法。該方法首先對單一電子產品的故障機理及故障特點進行了分析,結合變電站計算機監控系統的特點,對計算機監控系統的失效(故障)、壽命周期界定、延長壽命周期是否合理等判據進行了建模和定義,從而得出整個變電站級計算機監控系統的壽命評估結論和延長壽命策略。
電子產品的可靠性,是評估其質量好壞的重要指標之一,可靠性用概率表示時稱為可靠度,就是在規定的時間和規定使用條件下,無故障地發揮運行功能的概率[1-2]。國內外的現場數據都說明:正常運轉期的電子產品的故障率約等于常數。其物理意義是:在任何時間還在工作的產品,在單位時間內大體上以固定百分比的產品出現故障。例如抽檢某種大功率管9 800只,按照故障率每月2%,算出196只故障。以此類推,第12個月末,大體還剩3 641只不出現故障。由于電子產品在正常運行期內也會出現故障,其可靠性的高低在于故障率的大小,不像機械產品那樣,有一個基本不出現故障的正常工作期。
電子產品的任何故障總是由特定的化學、機械、熱、物理或電子驅使的故障機理所導致[3]。而產品抵抗內外部應力的能力,一般與產品局部位置的材料、結構等設計特性以及工藝特性有關,電子產品常見的潛在故障及其機理見表1。按故障機理可分為:
(1)過應力故障:A—脆裂;B—延展破裂;C—屈服;D—翹曲;E—大的彈性變形;F—軟錯誤;G—輻射導致的熱擊穿。
(2)耗損故障:J—腐蝕;K—樹枝狀生長物;L—內部擴散;M—疲勞裂紋生長;N—物質擴散;O—絕緣相關的失效;P—過量漏電;Q—鏈接界面的層裂;R—疲勞裂紋萌生;S—Frenkel缺陷增生;T—電遷移;U—金屬化層遷移;V—應力導致的擴散空穴(SDDV);W—電陷;X—EOS/ESD;Y—離子污染;Z—解聚(合)作用。
(3)輻射應力包括Gamma射線、Alpha粒子、快中子、宇宙射線、電子以及質子等作用。
從電子產品故障機理可以看出電子產品的失效是概率問題,可采用平均無故障時間(MTBF)描述。MTBF是衡量一個電子產品的可靠性指標,單位為“年”。它反映了產品的時間質量,體現產品在規定時間內保持功能的一種能力。
變電站計算機監控系統從板級到裝置、從裝置到系統的可靠性計算可采用以下方法:
(1)如果兩個部件看成串聯工作,其中一個發生失效,整個功能就失效了,系統MTBF計算為:
1/MTBFtotal=1/MTBF1+1/MTBF2
(2)對于并聯或冗余的結構,雖然一個部件失效,不影響其他部分功能,系統MTBF計算為:
1/MTBFtotal=1/MTBF1+1/MTBF2+(MTTR+0.1)/MTBFdouble/MTBFdouble
雙龍變計算機監控系統由多個電子裝置組成,3層結構,板件組成裝置、裝置組成系統。評估的數學模型應該體現3層結構的特點。計算機監控系統功能眾多,不能將單一功能的失效定義為監控系統的失效,同時電子產品的特點決定了其在正常運行時也會發生故障,因此不能將監控系統無故障作為系統運行目標。
判斷是否結束電子產品或者一個系統的壽命,涉及的因素包括故障率、故障后損失、維護的經濟成本、廠家技術支持保障等因素。應將故障率、故障后損失、廠家技術支持保障3個因素抽象化、定性化,或者將不易度量的指標轉化為直觀可度量的指標,對問題進行合理抽象簡化。
在此采用可靠性科學中的重要概念:

表1 電子產品故障位置和故障機理[4]
可用率=無故障時間/(無故障時間+修復時間)
根據不同功能在監控系統中的重要程度,將監控系統的不同裝置按不同的可用率要求劃分為三大類:可用率要求分別為99.8%(故障17.52 h內進行恢復);98.81%(故障4.3435天內進行恢復);91.67%(故障30.4045天內進行恢復)。
以雙龍變運行統計數據和系統裝置中邏輯圖計算板件可靠性和期望可用率作為基礎數據;再通過板件可靠性依次推算裝置、小室和系統可靠性,在分析過程中采用從板件到裝置、從裝置到系統的思路,分三級對可靠性進行分析計算。
研究過程中收集到的數據包括:計算機監控系統的實際運行缺陷統計及廠家提供的產品全球缺陷統計數據、設計時參考的可靠性數據、根據試驗數據進行預計的可靠性數據。數據質量的好壞直接關系到評價結果的準確性。
由于電子產品的故障屬于隨機事件,從數學角度考慮用概率問題進行判斷比較合適。作為概率問題,樣本數量的大小關系到是否對問題的本質能真實反映。對計算機監控系統的現場實際運行數據要嚴格進行統計,包括重新啟動后能恢復的缺陷數量,但樣本數量較廠商提供所有售出系統的統計數據少,很多故障在特定監控系統中并未發生,以單一監控系統的缺陷數據為基礎來估計可靠性顯然不合理,只能作為參考。
廠家提供的每年故障返修和修復次數的統計,數據比較全面,覆蓋年份比較大,詳細描述了同型號產品每年的實際故障情況。但是電子產品故障是隨機問題,廠家統計未發生的故障,不代表不會發生,而且各地的運行環境和管理水平不盡相同。因此這類數據適合利用擬合的方法來判斷故障屬于指數分布、威布爾分布或者泊松分布等數學分布。
廠家通常提供可靠性數據,例如MTBF,包括設計時參考及通過試驗估計的數據。這類數據都比較全面,數據涵蓋了電子產品的每個組成板子。尤其是通過試驗后估計的可靠性數據,很多參考文獻和廠家的工程師都指出該數據是對產品可靠性和壽命進行評價的可信度最高的數據。因此,廠家提供的通過試驗后估計的可靠性數據MTBF作為全壽命周期管理的基礎數據,應較為科學合理。
以國內首座綜合自動化變電站500 kV雙龍變作為評估對象,變電站監控系統的站控層系統采用了南瑞科技的SSJ2000系統。間隔層由西門子LSA678系統組成,站控主單元6MB5510/5515,站級聯鎖系統8TK1組成站控層,8TK2,I/O單元6MB522/524及同期裝置7VK組成間隔層。在500 kV小室、220 kV小室和35 kV小室分別設有間隔層主單元、8TK1/2和6MB監測控制系統。
500 kV雙龍變于1997年12月18日正式投入運行,所用8TK和6MB52*/5515等西門子公司產品已于2002年停產。因此迫切需要對雙龍變電站的間隔層LSA678系統壽命進行評估。
根據西門子提供的板級MTBF,計算裝置的MTBF。以6MB551*主單元可靠性計算為例:FP/LPII,SC/SK,SV,BF板為組成6MB5510/5515裝置主單元的基本元件(見圖1),其中任何一個板件故障會造成整個主單元故障。RK板是連接基本單元和擴展單元的關鍵部件,如果RK板故障會造成擴展單元所有的數據無法傳輸;BA板為命令輸出模塊,如果BA板故障則該板所有輸出命令無法實現;AR板為模擬量采集模塊,如果該板件故障則該板所有的模擬量數據無法獲得;DE板為狀態信號量采集模塊,如果該板件故障則該板所有狀態數據無法獲得。如圖1中圓形部件可造成整個裝置失效,橢圓形部件可造成部分失效,方框形部件可造成本部件失效。
根據其邏輯結構映射成為串、并聯關系,6MB5510(500 kV 1號、2號,220 kV 1號、2號、3號主單元),由 FP,RK,SK,AR,BA,BF,SV,DE板組成,其MTBF值為18.80。6MB5515(500 kV 3號主單元), 由 LPⅡ,RK,SC,AR,BF,SV,DE,BA板組成,其MTBF值為13.47。

圖1 6MB5510/5515裝置結構
同理依次計算6MB5512(主單元光纖通信箱),其MTBF為980;6MB524(I/O單元(具備閉鎖功能),MTBF值為202.53;8TK1(單元控制及閉鎖裝置),MTBF為88.17。8TK2(中央閉鎖單元),MTBF為 94.93;6MB522(I/O 單元),MTBF值為84.34;7VK(同期裝置),MTBF185??煽啃詮母叩降团帕袨椋?MB5512,7KG,7VK,6MB524,8TK1,8TK2,6MB522,8TK1, 8TK2, 6MB522。MTBF值大小可以衡量裝置可靠性,6MB5510和6MB5515主單元的MTBF值較低,可靠性也較其他裝置低。
根據裝置的連接關系,計算的小室可靠性見表2。

表2 小室可靠性分析結果
從小室可靠性來看,各小室的可靠性指標都比較接近,MTBF平均值為15.42。最后計算出整個變電站級的MTBF值為15.21。
根據MTBF的定義,當運行時間等于“平均無故障工作時間”,其對應的失效數量約占總數的50%~60%。雙龍變投運至今運行時間為14年,2012年將接近MTBF值15.21。因此需加強可靠性較低的重點裝置和重點板件的維護(停產前采購相關備品),根據西門子公司提供的產品報價,計算出維持正常運轉至運行到2013年總成本為174.8萬元。預計雙龍變自動化系統整體改造成本約1 800萬元,可正常運行12年,年平均折舊費用約150萬,2013年維護成本174.8萬元超過了折舊費用。從經濟性及安全角度考慮,建議從2012年開始進行監控系統的更新改造,以確保變電站的安全運行。
以500 kV變電站的計算機監控系統為研究對象,提出了一種變電站計算機監控系統壽命的評估方法,該方法為變電站計算機監控系統的全壽命周期管理提供了一種新的思路。
[1]盧昆祥.電子產品可靠性測試[M].天津:天津科學技術出版社,1987.
[2]CHEN ZEHUA,ZHENG HURONG.Lifetime distribution based degradation analysis[J].IEEE Transactions on Reliability,2005,54(1):3-10.
[3]J AYARAM J S R,GIRISH T.Reliability prediction through degradation data modeling using a quasi likeli hood approach[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2005.
[4]XU DI,ZHAO WENBIAO.Reliability prediction using multivariate degradation data[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2005.
[5]VLADIMIR CRK.Reliability assessment from degradation data[C]//Proceedings Annual Reliability and Maintainability Symposium.New York:Institute of Electrical and Electronics Engineers,2000.
[6]姚立真.可靠性物理[M].北京:電子工業出版社,2004.
[7]峁詩松,王玲玲.加速壽命試驗[M].北京:科學出版社,1997.