饒歡 陳鳳超 何毅鵬



摘 要:針對配電網配變不匹配的問題,本文提出基于分類決策樹對電網配變不匹配問題的故障診斷算法,通過獲取省海量平臺計量數據和營銷數據,從數據質量檢查、數據真實性校驗、數據修正和數據駁回四個步驟對數據進行分析,從而達到提高數據質量的目的,分類決策樹算法的應用可以輔助調度人員迅速識別故障,保證配電網的安全穩定運行。
關鍵詞:配電變壓器;決策樹算法;數據質量;故障診斷
0 引言
配電變壓器數據中電壓或電流超限后報警,配網調度員從數據庫中核查報警位置處理數據,調取臺賬數據與原始報文,逐一排查配變匹配問題。這種利用手工排查故障過程十分繁瑣,需要大量人力而且容易出錯,自動化數據校驗水平較低。為提高故障診斷的準確性和快速性,一些學者提出了基于專家系統[1]、人工神經網絡[2]、遺傳算法[3]和Petri網絡[4]的等多種排查方法,上述方法均存在一定的局限性,基于分類決策樹對電網配變不匹配問題的算法應用適應各種不利情況的配電網故障診斷方法,輔助調度人員迅速識別故障,保證配電網的安全穩定運行。
1 決策樹算法
1.1 決策樹算法原理
決策樹[5-7]是在已知情況發生概率的基礎上,通過構成決策樹來計算凈現值的期望值是否大于等于零的概率,判斷發生問題可行性的決策分析方法。在機器學習中,決策樹是一個預測計算模型,它代表的是對象屬性與對象值之間的相互映射關系。決策樹是一種樹形結構,其中決策樹每個內部節點表示一個屬性上的測試,決策樹每個分支代表一個測試輸出,決策樹每個葉節點表示一種類別。
1.2 分類決策樹算法原理
分類樹是一種比較常用的分類方法,屬于一種有監督機器學習算法,從一堆待測試樣本中選取樣本,每個樣本都有一組相應的屬性和類別,屬性和類別是提前確定的,那么通過有監督學習得到一個分類器,分類器可以新的樣本給出正確的分類。分類決策樹模型表示一種對實例進行樣本分類的樹形結構,決策樹通常由有向邊和結點兩部分組成,樣本中的每個結點由內部節點和葉子節點組成。內部節點通常表示的是特征或者屬性,葉子節點表示單個獨立的個體,屬于不能再細分的類別。當樣本的節點進行分類劃分時,從一個根節點開始,針對實例的某一特征向量進行測試,依據樣本的測試結果,將樣本實例分配到其子結點,每一個樣本子結點和特征的取值相對應。設置相應閾值,不斷遞歸向下移動,到達葉結點為止,這時將樣本實例分配到葉子結點的種類。
1.3 分類決策樹的建立
分類決策樹剪枝是針對決策樹過早擬合問題而提出來的。分類決策樹剪枝一般分先剪枝和后剪枝。通過提前停止樹的構造方法屬于先剪枝,假如決定在某個關鍵節點不再進行分裂,對樹節點進行剪枝,如果剪枝停止,那么該節點就變成樣本中的葉子節點。對該葉子節點選取包含樣本子集中類別最多的一個類,作為樣本節點的一個類別。后剪枝是針對完全成長的樹進行剪枝,通過去掉節點的分枝,用葉子節點代替,葉子節點用子集中類別中出現頻率最高的類別進行標記。本文基于分類決策樹對電網配變不匹配問題的故障診斷算法采用后剪枝的策略。
2 整體實現
本文從數據質量檢查、數據真實性校驗、數據修正和數據駁回四個步驟實現了解決電網配變不匹配問題,在同一個用戶同時擁有高供高計和高供低計兩個測量點,電壓數據經常在高壓側和低壓側切換,造成電壓越限。用戶側設備更新,而計量系統或營銷系統中的變比數據未及時同步或填寫不規范,或由于計費原因不能同步更新,直接影響PQIU等量測數據計算。本文數據來源于某省海量平臺計量數據和省海量平臺營銷數據,先匹配臺帳營銷數據,獲取導致錯誤異常報數據警,系統中對UI設定上下限的閾值。獲取某省海量平臺計量數據和省海量平臺營銷數據。檢查電壓電流,匹配臺帳營銷數據,提取異常報警數據,檢查異常數據確實、重復情況,如果沒有重復,提取異常超限數據,提取數據相關匹配、變比、電壓、電流信息,利用變比關系對比量測數據,高供高記變比計算和高供低記變比計算,利用變比關系對比量測數據,如果匹配,錄入缺失數據計量點位,如果不匹配。利用專家系統分析具體原因[8,9],建立數據規則,利用決策樹皮判別,訓練決策樹參數,載入后續參數,分析電壓電流報警原因,建立數據集規則,判斷是否誤報警,如果沒有報警輸出真實報警信息,并重新檢查線路功率,如果報警,恢復變比數據,包含匹配信息、變比信息、電壓計量數據和電流計量數據。
2.1 數據質量檢查
首先由計量系統得到越限警告,核查越限處數據是否有缺失、重復、格式錯誤,如果數據有問題,結束質量檢查;再判斷數據有問題的次數,生成錯誤報告,結束質量檢查,如果數據多次沒有問題,從省海量平臺重新下載數據。提取報警數據,校驗警報信息的完整性,包括報警數據的時間、地點、設備編號、報警類型與嚴重程度,并且需要檢查報警時間是否缺失。報警地點與報警設備線路需要相匹配,報警設備編號與臺賬數據信息需要匹配等。等待報警類型提取確認,查看是否存在明顯誤報信息如圖1所示。
2.2 數據真實性校驗
使用基于決策樹的專家系統判別錯誤原因,判別規則流程如圖2所示,越線比例安裝大、中、小三個維度來劃分,持續時間按長、短兩個維度來劃分,其中規則中的“大”、“中”、“小”、“長”和“短”等詞語使用明確的閾值替代。排查工作集從越線比例大小、持續發生時間長短、是否斷續出現、是否有高供高計和高供低計混亂。
擬使用分類和回歸書(CART)模型來訓練閾值。CART描述如:用s表示閾值,t表示節點位置,則s的優劣衡量為:其中tL,tR為t的左/右子節點,其中,PL代表左子節點的記錄數占訓練集的記錄數比例,PR代表右子節點的記錄數占訓練集的記錄數比例,P(j|tL)表示在tL處,j類的記錄數占節點的記錄數的比例,P(j|tR)表示在tR處,j類的記錄數占節點的記錄數的比例,使用Φ(s|t)取得最大值的劃分閾值作為本條規則的閾值。
2.3 數據修正
當配電變壓器重過載報警,負載超限60%,持續發生30分鐘閾值大于12h,時常出現斷續,利用分類決策樹算法進行數據分析和過濾,如果沒有超限,將數據寫入修正工單如圖3所示。
2.4 數據駁回
當越限比例閾值大于130%,持續時間大于16h,采用分類決策樹算法,如果沒有斷續出現,變比未及時更新,將數據駁回進行手工排查如圖4所示。
3 結語
本文提出基于分類決策樹對電網配變不匹配問題的故障診斷算法,從數據質量檢查、數據真實性校驗、數據修正和數據駁回四個步驟實現了電網配變不匹配問題的快速診斷和定位。該故障診斷流程包括分類決策樹的建立、剪枝與測試。與其他分類算法相比,分類決策樹不需要參數假設,且準確率較。
參考文獻
[1] 劉少宇,郭宗軍,董明,等.專家系統在變電站設備診斷中的應用[J].高電壓技術,2001(5):17-19.
[2] 陳長征,勾軼,王毅,等.基于遺傳神經網絡的汽輪發電機組故障診斷研究[J].高電壓技術,2003(8):1-2+25.
[3] 顏景斌,夏賽,王飛,等.基于改進遺傳算法的有源配電網故障定位分析[J].電力系統及其自動化學報,2019(6):107-112.
[4] 劉棟,陳允平,沈廣,等.基于UML和Petri網的電力系統恢復模型[J].高電壓技術,2006(6):90-93+121.
[5] 焦亞男,馬杰.一種改進的MEP決策樹剪枝算法[J].河北工業大學學報,2019(6):24-29.
[6] 王英英,羅毅,涂光瑜.基于粗糙集與決策樹的配電網故障診斷方法[J].高電壓技術,2008(4):794-798.
[7] 中國電力科學研究院,國家電網公司,國網遼寧省電力有限公司沈陽供電公司.基于復雜事件處理技術和決策樹的配電網態勢感知方法:CN201610237515.2[P].2016-09-07.
[8] 馬春雷,丁健,陳宣林,等.基于決策樹自標識的主動配電網狀態估計算法[J].電力大數據,2019(5):26-32.
[9] 陳思翰.試析智能配電網技術在配電網中的應用[J].大科技,2019(35):101.