谷海彤 張遠亮 盧翔智 崔卓 杜錦陽



摘要:戶變拓撲關系的準確識別一直是電網運營過程中一個亟待解決的難題,從技術上尋求臺區戶變拓撲關系信息識別的方法已迫在眉睫。針對智能電網中部分集采臺區存在戶變關系混亂的情況,本文利用數據挖掘技術對電力通訊載波信號數據進行分析,基于增量式決策樹算法設計了臺區戶變拓撲關系的辨識方法,實現了戶變拓撲關系及時準確的維護。實際運行結果表明:該模型較之傳統的決策樹算法和貝葉斯模型具有更高的準確度,能有效提高臺區用戶信息識別的實時性和可靠性。
關鍵詞:數據挖掘;戶變拓撲關系識別;通訊載波
中圖分類號:TM76 文獻標識碼:A 文章編號:1007-9416(2019)12-0116-02
0 引言
計量自動化系統是智能電網的重要組成部分,然而由于多種因素,投入運行的部分集采臺區存在戶變關系混亂的情況,影響臺區線損分析等關鍵技術指標,進而阻礙了計量自動化系統的推廣應用。近年來,數據挖掘、機器學習等智能技術的發展為實現臺區戶變關系的識別提供了諸多行之有效的方法,這些理論和技術已經在電網運營中取得了成功的經驗,例如,將數據挖掘應用于智能電網,鄒云峰鄧利用K均值聚類(K-means)實現了臺區合理線損預測[1]、張藍宇等運用聚類算法和關聯分析法,搭建了線損管控、評估與智能診析模型實現了臺區線損管理的快速診斷決策[2]。本文則利用與電網拓撲關系緊密相關的載波技術,基于通信載波中所能夠提供的計量信息,提出了一種基于增量決策樹算法的戶變拓撲關系辨識方法,通過數據挖掘的方式建立戶變拓撲關系的識別模型并對其進行維護,用以提升戶變拓撲關系識別的準確率。
1 系統工作原理
本系統利用寬帶載波技術,實現了基于增量式決策樹算法的戶變拓撲關系識別相關的設備,在電網運營具體實施時,主站發送開始臺區識別指令,CCO將該指令轉給戶變識別設備,戶變識別設備發射信號,由臺區內寬帶載波(STA)模塊負責回應,CCO根據收到的上報數據利用決策樹算法進行拓撲關系的自動識別,并與自己網內的拓撲檔案進行比較,將分類異常的用戶進行剔除.該過程主要分為兩個階段:第一階段為啟動階段,其示意圖如圖1所示,待識別臺區(A)中的集中器載波模塊進行數據廣播,要求站點啟動臺區識別功能,正常廣播的數據,其他臺區的站點也有可能回應。由抄控寶于過零點發射識別信號。該信號采用的頻率和調制方式與正常PLC通訊方式不同。其內容為本臺區通訊模塊的SNID和工作模式。
臺區識別流程第二階段為下發SNID并生成正確表檔案,其示意圖如圖2所示,由臺區A集中器模塊發起讀命令,來查看各節點回應信號并進行增量式決策樹的識別算法,根據識別的分類結果,CCO模塊會發現STA2_21屬于異常分類,而STA1_24屬于本區域的正常分類。于是可根據此結果生成正確的檔案。因此節點STA1_24會知道自己的SNID已經錯誤,會主動退出臺區B并加入臺區A,如圖2中灰色節點所示,即完成了臺區的正確辨識。
臺區識別流程的結束由發起時定義的超時時間決定,目前一般定義為60分鐘以內。臺區識別結束后,所變更的臺區對應關系會被恢復為與主站設置檔案一致。即臺區識別只提供正確的臺區對應表,并不更改集中器檔案,防止本地檔案與主站不一致。
2 增量式決策樹算法
決策樹分類算法是通過一系列規則對數據進行分類的過程,用于來發現數據中蘊涵的分類規則[3]。但是由于電網大數據的特性,數據集隨時間推移不斷增大,如果每次建模過程都需要對所有數據進行訓練會大幅度增加算法的時空復雜度。理論上基于貝葉斯估計的增量學習分類器是解決這個問題的有效途徑,該算法在已有數據集的基礎上,僅針對新樣本對原有模型進行更新,可以保證算法的快速性和有效性。因此本文考慮將兩者相結合,建立戶變拓撲關系的辨識模型。該算法主要分為兩個階段,首先將樣本訓練集的一部分作為初始樣本數據集來生成初始決策樹T0;然后在初始決策樹的基礎上執行后續新樣本的增量學習。
假設根據某個樣本數據集生成的決策樹中一個節點屬性空間為D,之后依據此樣本數據集的屬性空間和分類情況作為貝葉斯分類器的參數,當接收到新的樣本數據后,對到達這個節點的樣本數據進行樸素貝葉斯分類,這種節點稱為貝葉斯結點。增量式決策樹算法執行過程如圖3所示[4],當產生一個新的訓練集樣本時,決策樹算法將該實例與已生成決策樹中劃分的屬性進行匹配,并在到達葉節點時終止操作。如果到達的節點不是貝葉斯節點,則需要判斷該實例的劃分是否正確。如果劃分結果準確,則決策樹的結構參數不會發生任何更改,否則,如果基于貝葉斯分類方法的結果比決策樹分類方法更加準確,則將此節點轉換為貝葉斯節點。如果該節點是貝葉斯節點,則結合實例更新修正該節點的貝葉斯參數。因此,可以根據上述流程,通過連續遞歸的方式構建增量式決策樹。
3 實驗結果分析
本文主要利用載波通信數據來對算法進行對比實驗測試對某供電營業所所屬45個臺區戶變拓撲關系進行了模型有效性的檢驗,測試數據中所有臺區的用電客戶數量為3846個,通訊載波信息記錄數約為120萬條。在網絡的建立和測試過程中,利用電力載波通信信號品質數據作歸一化處理作為訓練樣本輸入數據,信號品質范圍為0-1,選用本文提出的增量式決策樹算法與經典決策樹C4.5算法和貝葉斯分類算法的耗時以及準確率進行對比,測試戶變拓撲關系識別模型的性能分別如圖4和圖5所示。實驗中選取不同大小的數據集進行測試,橫坐標中的數字1,2,3,4分別代表數據集大小為1000,5000,10000和20000。
從圖4和圖5中可以看出,增量決策樹算法在沒有明顯增加計算負擔的前提條件下,其分類準確率比其他兩種算法有明顯提升,同時,隨著數據量的增大準確率波動較小,體現了該算法優良的分類性能以及算法的魯棒性。
4 結語
本文面向臺區戶變拓撲關系的辨識問題,將決策樹算法和貝葉斯增量式學習融合,提出了基于載波技術的增量式決策樹算法用以準確識別臺區戶變拓撲關系。測試結果表明該算法能夠滿足電力公司對戶變拓撲關系識別精度的要求,在計量自動化系統的推廣應用方面發揮了積極的作用。
參考文獻
[1] 鄒云峰,梅飛,李悅.基于數據挖掘技術的臺區合理線損預測模型研究[J].電力需求側管理,2015,17(4):25-29.
[2] 張藍宇,陳藝云,海入.基于數據挖掘技術的臺區線損智能診斷研究及應用[J].湖南電力,2019,39(2):16-20.
[3] 刁智華,趙春江,郭新宇.一種新的基于平衡決策樹的SVM多類分類算法[J].控制與決策,2011(1):149-152.
[4] 王明星.數據挖掘算法優化研究與應用[D].安徽大學,2014.
Research on the transformer area identification algorithm based on data mining
GU Hai-tong,ZHANG Yuan-liang,LU Xiang-zhi,CUI Zhuo,DU Jin-yang
(Guangzhou Power Supply Bureau Co., Ltd., Guangzhou? Guangdong? 510620)
Abstract:The accurate maintenance of the topology relationship of the transformer area has always been a difficult problem for the power grid company. At present, technical breakthroughs must be sought to solve the bottleneck problem of accurately identifying the topology relationship across the transformer area. In this paper, an incremental decision tree algorithm was proposed to identify the relationship based on the analysis of the power line carrier communication technology through the data mining technology. The actual operation results showed that the model has the advantages of high recognition accuracy than the Bayesian model and can effectively improve the real-time and reliability of user information identification.
Key words:data mining;transformer area identification;power line carrier