吳廣財 周睿 嚴宇平
摘 要: 設備巡視是預控設備運行風險,夯實電網安全運行基礎的重要手段。通過以某省級電網公司35 kV及以上油浸式主變的歷史數據為基礎,構建了基于Logistc回歸方法的主變個體缺陷概率預測模型,并提出了基于主變個體缺陷概率預測的設備巡視重點制定方法,通過實證數據驗證了基于主變個體缺陷概率預測開展設備巡視的有效性。
關鍵詞: 主變壓器; 缺陷概率預測; Logistic模型; 設備巡視
中圖分類號: TN710?34 文獻標識碼: A 文章編號: 1004?373X(2015)05?0106?04
Main transformer inspection strategy optimization
based on prediction of defect probability
WU Guang?cai1, ZHOU Rui2, YAN Yu?ping2
(1. Information Center, Guangdong Power Grid Co., Ltd., Guangzhou 510180, China; 2. Guangdong Power Grid Co., Ltd., Guangzhou 510600, China)
Abstract: Device inspection is a significant means to control the risk and maintain the safe running of power grid. A defect probability prediction model based on logistic regression method is established on the basis of historical data of 35 kV and above oil?immersed transformers in a provincial power grid company. A method to generate the inspection strategy based on the model predicting the defect probability of individual transformer is proposed. The availability of the device inspection based on defect probability prediction for individual transformer is proved with real evidence data and empirical analysis.
Keywords: main transformer; defect probability prediction; logistic model; device inspection
0 引 言
設備巡視是預控設備運行風險,提高設備健康水平,保障電網安全穩定運行的重要途徑,其重點是及時發現和消除設備隱患,確保電網設備安全穩定運行。目前,電網企業主要的設備巡視方式大體有兩種:日常巡視與特別巡視。為優化巡視效果,研究人員嘗試從多個角度進行巡視策略優化研究,如廣州供電局王邦志等、廣西電網黃浩等的巡視工具優化研究[1?2],廣東電網電力科學研究院喇元等提出了基于風險、設備狀態的電力設備巡視策略優化 [3?4]。華南理工大學謝金泉等提出了基于設備缺陷的巡視策略[5],具有一定的借鑒意義,但僅以設備缺陷數量判定缺陷狀態過于簡單。
為提高巡視的效率,一種有效的方法是開展設備的缺陷預測,對此許多學者進行了較為深入的研究。如張增敏等利用數據挖掘的關聯規則、分類、回歸、決策樹等進行設備缺陷的預測[6?7],陳義剛等利用支持向量機構建了設備缺陷的預測模型[8]。但這些模型都是基于大量個體的宏觀信息對特定類型的設備開展的缺陷預測,可應用于特定類型設備的缺陷預測,并不完全適用于設備個體,對于設備個體的巡視工作重點制定缺乏指導意義。因此,本文嘗試提出一種基于Logistic回歸分析主變個體缺陷概率預測方法,并在此基礎上提出了主變巡視策略的優化方法。
1 基于Logistic回歸分析的主變缺陷概率預測
模型構建
Logistic模型由Malthus方程發展而來,常用來預測離散因變量與一組解釋變量之間的關系,其通過logit變換轉化為線性形式,可實現參數的估計[9]。由于Logistic模型對變量類型、數據的正態性等不作要求,并具有系數可解釋的優點,其在醫學、社會學等領域都得到了廣泛應用。本文以某省級電網公司35 kV及以上油浸式主變缺陷數據為例,利用Logistic模型實現主變個體缺陷概率的預測。
1.1 模型輸入變量選擇
主變是否發生缺陷與主變的設備型式(比如調壓方式)、歷史缺陷情況、生產廠家等多種因素都有關,通過對信息化系統中主變現有數據的梳理,結合電網行業專家的經驗,本研究梳理了影響主變缺陷概率的16個狀態量,如表1所示。
1.2 輸入變量值分組
為提高預測精度,本研究對輸入變量取值進行分組,并采用WOE(Weight of Evidence)值用于衡量輸入變量取特定值時對目標變量的影響程度,IV(Information Value)值表征自變量所包含的信息量大小,用于衡量變量的預測能力[10]。
用Pct1表示指定輸入條件下發生缺陷的主變數量占訓練數據中發生缺陷的所有主變數量的百分比,Pct0表示指定條件下未發生缺陷的主變數量占訓練數據中未發生缺陷的主變數量的百分比,計算輸入變量每個值的WOE:
[WOE=ln(Pct1)-ln(Pct0)] (1)
將WOE值相近的項進行合并分組,并根據分組結果以及對應WOE值計算各模型輸入變量的IV值:
[PCT=Pct1-Pct0] (2)
[IV=WOE×PCT] (3)
對于每個變量,其分組內WOE值越大,缺陷概率越高。IV值越大,變量對缺陷概率的影響越大。以該省級電網公司2008—2011年主變缺陷記錄作為訓練數據,計算各變量的WOE值及IV值,從而便于找到對設備缺陷概率有顯著影響的變量,如表2所示。
從表2中可以看出:“近24個月缺陷數量”變量內各種數值的WOE值相差很大,IV值顯著高于“污區等級”變量,這說明“近24個月缺陷數量”這一因素對缺陷發生的概率的影響程度要大于“污區等級”因素。注意這里“影響程度”是從數據分析挖掘的角度來說的,也即模型的最終輸出結果對該變量的敏感度較高。從物理意義上來說,“近24個月缺陷數量”并不是缺陷是否發生的影響因素。
1.3 預測模型構建
假設在輸入變量[X1,][X2,][…,][Xn]作用下,缺陷發生的概率為[p,]則缺陷不發生的概率為[1-p,]取[θp]為:
[θp=logit(p)=lnp1-p] (4)
式中:logit(p)是輸入變量X=1的差異比的自然對數。[θp]以logit(0.5)=0為中心對稱,且在p=0和p=1附近變化幅度較大,當p從0變化到1時,[θ]p從-∞變化到+∞。則:
[θp=lnp1-p=β0+β1X1+β2X2+…+βnXn] (5)
則缺陷發生概率[p]的計算公式為:
[p=e1-(β0+β1X1+β2X2+…+βnXn)] (6)
令[α=β0+β1X1+β2X2+…+βnXn,]則[p=1e-α。]其中[|α|]與主變缺陷概率[p]單調性一致。與WOE的關系為:
[α=β0+β1WOE1+β2WOE2+…+βnWOEn] (7)
式中:[WOE1,][WOE2,][…,][WOEn]表示各變量WOE值。
以該電網公司2008—2011年的數據作為訓練數據,2012年的數據作為驗證數據,2013年的數據作為測試數據,利用SAS中Wald 統計量對模型偏回歸系數的顯著水平進行檢驗,剔除對因變量解釋能力較差的因素,如“設備近12個月的缺陷數量”等,參數估計結果如表3所示。
從訓練結果可以看出,設備運行環境的污區等級、電壓等級、設備近2年發生缺陷的次數及近6個月發生缺陷的次數、設備廠商以及設備投運時間是影響主變缺陷概率預測結果的重要變量。
2 基于缺陷概率預測的巡視策略優化
利用設備缺陷概率預測模型,可輔助設備管理人員安排有針對性的重點設備巡視和維護。在Logistic模型中,并不存在理論上的最優預測概率,即預測概率可為[0,1]區間上的任何值。但當預測概率不同時,模型預測結果的第一類錯誤概率(誤判率,及設備實際上沒有發生缺陷,但判為有缺陷)和第二類錯誤概率(漏判率,即設備實際上發生了缺陷,但判為無缺陷)也不同,第一類錯誤概率的減少意味著第二類錯誤概率的增加。由于電網在運行過程,從確保安全可靠的角度出發,需要盡可能全面地發現缺陷,因此,在實際應用中更傾向于降低第二類錯誤概率。在實際應用中,可結合模型的誤判率和漏判率,確定重點巡視設備。
以該省級電網公司主變為例,將其所有主變按缺陷概率由高至低進行排序,結果如圖1所示。
由圖1可知,以排名在50%的設備的缺陷概率[p]作為預測概率,當概率大于[p]時認為該設備發生缺陷,此時漏判率小于8%,較為理想,可作為主變巡視重點的判定依據。根據圖1,結合電網風險等級,可確定主變的巡視重要性類別矩陣如表3所示。其中I類為最需關注的設備,IV類為最不需要關注的設備。
結合該省級電網公司的巡視周期,將Ⅰ類設備巡視周期定為1天1次,Ⅱ類設備巡視周期定為2天1次,Ⅲ類設備巡視周期定為1周1次,Ⅳ類設備巡視周期定為1月1次。
該策略在該省級電網公司下一級試點地市局應用后,實施新策略前(2014年6月份)與實施新策略后(2013年6月份)變電設備的巡視工作量如表4所示。
2013—2014年間,該地市局新增變電站1座,新增主變占總設備數量的0.7%,由于設備較新,非缺陷主要來源。對比上述數據,實施新策略后,運維消耗的工作量大幅下降(如日常巡視工作量僅占實施策略前的21%),但發現的缺陷數量反而增多。這說明采用上述策略后,有效降低了巡視運維的工作量,并有利于巡視人員集中精力于最有可能發生問題的設備上,提高巡視效率。
對比該地市局2013年6—7月、2014年4—5月和2014年6—7月事故事件數據數據可見:在實施新運維策略前后,以及去年同期,同樣時間區間內,事故事件數量沒有明顯變化,且均由于自然環境(雷擊、臺風等)或者外力而導致,沒有發生因設備運維不當而導致的事故事件。從總體上看,采取新的策略沒有導致事故事件數量和頻率的變化,對電網安全基本沒有影響,進一步證明了該方法的有效性。
3 結 語
本文以某省級電網公司主變缺陷數據為例,基于Logistic模型,構建了主變缺陷概率預測模型。在此基礎上,結合模型的錯誤率和誤判率分析提出了基于缺陷概率預測的巡視策略優化,根據設備缺陷概率差異情況,有針對性地進行重點巡視和維護,提高工作效率,并通過實證研究,證明了該方法的有效性,說明該方法有利于加強對重要設備、健康狀況不良設備的運行維護,提高了工作效率。
參考文獻
[1] 王邦志,徐正清.一種靈活的設備巡視仿真機制在變電培訓仿真系統中的應用[J].廣東電力,2003,16(5):46?48.
[2] 黃浩.標準化變電站巡視系統的研發與應用[J].南方電網技術,2011,5(2):89?91.
[3] 喇元,王紅斌,陳忠東.基于狀態評價及風險評估的輸變電設備狀態檢修策略的研究[J].廣東電力,2010(10):36?40.
[4] 林秋蓉,王相南,林遠能,等.變電設備差異化巡視策略的實施[J].電力安全技術,2014(6):16?18.
[5] 謝金泉,李曉華,何毅,等.變電設備狀態巡視策略研究[J].廣東電力,2012(9):5?9.
[6] 張增敏.數據挖掘技術在變電站設備及缺陷管理系統中的應用[D].西安:西安理工大學,2006.
[7] 陳擁軍.電力系統設備缺陷預測[D].杭州:浙江大學,2003.
[8] 陳義剛,徐厚東.基于支持向量機的變電設備缺陷發生率的預測及應用[J].四川電力技術,2013(6):75?77.
[9] 薛毅,陳立萍.統計建模與R軟件[M].北京:清華大學出版社,2007.
[10] HOPE B, CLARKSON J. A Strategy for using weight?of?evidence methods in ecological risk assessments [J]. Human and Ecological Risk Assessment, 2014, 20(2): 290?315.