李 蓓,胡筱曼,林文浩,熊 力
(南方電網廣東中山供電局,廣東 中山 528400)
目前,配網臺區用戶側的信息化水平低下、管理混亂,電力用戶服務水平仍然存在用戶停電信息不準確、無法實現主動告警、供電恢復時間長等問題。當低壓側發生故障時,由于臺區低壓接線信息缺失或不準確,低壓臺區停電故障多依靠用戶電話報障以及搶修人員逐戶排查,難以實現低壓側主動搶修。這影響了用戶用電服務體驗滿意度。當前,通過低壓側加裝大量監測裝置實現停電告警的技術存在前期投資大和后期維護成本高的問題,難以推廣應用[1]。
文獻[2]提出1種基于方向分層拓撲的算法,從而確定低壓臺區發生故障的位置。文獻[3]通過數字孿生技術在低壓臺區的應用,在線路發生異常時能夠及時判斷出停電范圍。文獻[4]設計了1種基于饋線終端單元的配電網故障定位系統,根據發生故障時的故障電流確定故障所在區段。文獻[5]提出基于配網拓撲矩陣的供電可靠性評估方法,根據故障率關聯矩陣與故障時間關聯矩陣確定負荷點平均故障時間向量。文獻[6]通過配網設備的連接關系使系統快速地定位停電范圍,再根據營銷系統數據庫查詢得出停電的影響范圍。由于目前低壓臺區信息化水平不高,拓撲接線信息容易缺失或不準確,導致這些方法存在較大的誤差。而配網管理缺乏完整的維護體系,較少涉及低壓系統的其他高級應用。
針對以上問題,本文提出1種基于特征用戶選擇的停電范圍判定方法,從而實現低壓配網的故障停電主動告警,以減少設備的前期投資、全面提升用戶的舒適用電感受和服務體驗。該方法首先使用K-means++聚類算法對臺區用戶進行聚類劃分,并計算用戶間的停電相關性系數;然后,對相關性系數高的用戶加裝智能電表,根據用戶停電狀態進行臺區停電范圍判定;最后,結合具體臺區算例驗證方法的準確性。
為了實現低壓臺區的智能化,目前的主要方法是針對低壓側的臺區、電表等設備對象,更換集中器、新一代計量表以及加裝其他智能控制設備等。
①針對臺區側,通過更換集中器設備,對分路實現本地化實時監測,以提升臺區、分路停電告警及臺區運行狀態統計分析的本地智能化水平,并實現用戶用電狀態召測及用戶停電告警信號的收集。對于用戶停/復電,則通過集中器對臺區全部用戶或任意設定的特征用戶召測的方式判斷。
②針對用戶側,可加裝含停電主動告警功能的智能電表。根據建設原則和預期目標,臺區全部用戶電表可更換為含停電主動告警功能的智能電表。當部分區域發生停電事件時,區域內的智能電表將停電信息主動上送,以實現目標臺區用戶停電范圍的判定。
由此可見,若要實現臺區用戶的主動告警,需要安裝大量的智能電表??紤]到智能電網建設的經濟性,本文提出1種基于特征用戶選擇的停電范圍判定方法。該方法根據同相且電氣距離相近的用戶在停電方面具有較強相似性的原則[7],對臺區全部用戶進行聚類劃分,篩選出部分停電相關性較強的用戶加裝含停電主動告警功能的智能電表。當臺區發生停電事件時,停電區域內加裝智能電表的用戶將停電信息上傳至集中器,由集中器對其余用戶進行輪詢,從而實現用戶停電范圍的判定。臺區停電告警技術方案原理如圖1所示。

圖1 臺區停電告警技術方案原理Fig.1 Principle of outage alarm technology scheme of the station area
K-means++聚類算法使用點與點之間的歐氏距離作為區分的度量。區別于傳統K-means算法,K-means++聚類算法基于事先指定簇的數目或聚類中心,經過反復迭代,直至達到“同簇內各點的距離足夠近,各簇間點距離足夠遠”的目標[8]。
K-means++算法流程如圖2所示。

圖2 K-means++算法流程圖Fig.2 K-means++ algorithm flowchart
K-means++聚類算法的目的是把所有樣本劃分到不同區域中,使每個區域中樣本間的方差最小。
(1)

(2)
每個樣本被選為下個聚類中心的概率P(x)為:
(3)
式中:D(x)為每個樣本與當前已有聚類中心之間的最短距離。
本文選出所有的聚類中心后,計算所有樣本到已經確定的聚類中心的距離,將樣本重新劃分至對應的類中。根據所得到的分類結果,本文重新計算聚類中心。
由于聚類屬于無監督學習范疇,在缺少數據標簽的情況下,其評價指標不同于有監督分類算法。本小節以無監督學習和高維數據為出發點,介紹幾種內部聚類評價指標。
①輪廓系數(silhouette coefficient,SC)結合了聚類簇的凝聚度以及簇間分離度[9],取值范圍為-1~+1。SC得分越高,則聚類結果越好。SC的定義為:
(4)
式中:a為樣本數據與同簇內其他數據之間的平均距離;b為樣本數據與距離其最近的其他簇中所包含的所有數據的平均距離。
②卡林斯基-哈拉巴薩(Calinski-Harabasz,CH)指數通過計算簇中數據與簇中心距離的平方和定義簇內凝聚度,計算各簇的中心與數據集中心距離的平方和,從而定義分離度。CH指數的定義是分離度和凝聚度的比值:
(5)
式中:nD為樣本數據集;Btr為簇間協方差矩陣B的跡;Wtr為簇內協方差矩陣W的跡。
由式(5)可知,CH指數值越大,聚類后簇自身越緊湊,簇與簇之間越分散,聚類效果越好。B、W分別如式(6)、式(7)所示。
(6)
式中:nq為第q個簇內的數據數目;CD為數據集D的中心;Cq為第q個簇內數據點的集合;T為轉置。
(7)
③戴維森堡丁(Davies Bouldin,DB)指數表示簇間的平均相似度。DB指數將不同簇中心的距離與不同簇內數據到其簇中心的平均距離進行比較,為:
(8)
式中:Wi和Wj分別為第i個、第j個簇中所有數據到其所在簇中心的平均距離;dij為第i個、第j個簇的簇中心之間距離。
不同于上述SC、CH指數,DB指數越低(最小值為0),則集群之間的分離越好,聚類效果也越好。
基于已經預處理的電表數據集,本文以用戶為單位采用K-means++算法進行聚類,并分別計算不同k下SC、CH、DB這3個無監督聚類評價指標,以實現在不同參數下聚類性能的評價,從而確定最優的聚類參數值。
停電相關性系數的計算數據來源于“營-配”業務深度融合的數據平臺。該平臺可用于獲取不同時刻的電表數據。由于臺區用戶數目眾多,電表數據隨時間不斷更新且增長迅速,對所有用戶進行停電相關性系數的計算顯得不切實際。因此,本文將用戶劃分為若干聚類簇,在聚類簇內進行分析研判更為方便。
圖3為停電相關性系數計算流程。

圖3 停電相關性系數計算流程圖Fig.3 Outage correlation coefficient calculation flowchart
在臺區用戶聚類基礎上,本文提取并預處理同簇內所有用戶電表數據,通過相關性定義算法[10]依次計算同簇內所有用戶間的停電相關性系數ρ。
(9)

基于同簇內用戶間停電相關性系數,本文得到相應屬性與停電相關性關聯度等級。所述的相關性系數介于-1~+1。相關性系數絕對值越大,所代表的用戶間停電關聯度越高。
基于上述所得聚類結果,對于簇內只含2個用戶的聚類簇,可隨機選擇特征用戶。若聚類簇內用戶擁有3個及以上用戶,基于相關性系數矩陣,本文選取綜合停電相關性系數最高的用戶作為特征用戶。
(10)
基于特征用戶選取結果,可對特征用戶加裝含超級電容器的智能電表。通過智能電表實時告警上傳技術,主站可實時監測各特征用戶的停用電狀態。
為驗證所述停電范圍分析的有效性,本文采用某地區實際低壓臺區拓撲結構進行試驗。該臺區共有100個用戶。
臺區結構如圖4所示。

圖4 臺區結構示意圖Fig.4 Schematic diagram of station area structure
圖4分別用不同符號表示A、B、C三相線路用戶。本文記錄100個用戶在60個不同時刻內的電壓數據,并以用戶為單位對處理后的數據采用K-means++算法進行聚類。預估聚類參數取值范圍為[36,43]。
本文分別計算不同聚類參數下SC、CH、DB這3個無監督聚類評價指標,進而實現在不同參數下聚類性能的評價。
不同聚類參數下各聚類指數得分如圖5所示。

圖5 不同聚類參數下各聚類指數得分Fig.5 Score of each clustering index under different clustering parameter
由前文可知,SC和CH得分越高、DB得分越低,說明聚類效果越好、參數選擇越合理。由圖5可知,當聚類參數分別為39、40、41時,SC具有較高的得分;隨著聚類參數的不斷增大,CH指數呈逐步增高的趨勢,DB指數呈現先降低再緩慢上升的趨勢。同時考慮兼顧多個聚類評價指標,本文選擇聚類參數為39,即將原始100個電表聚成39類以進行后續研究。
當聚類參數為39時,SC、CH、DB這3個指數均具有較好表現。故在此參數下,K-means++聚類算法能夠在相應算例數據集上取得較好的結果。
以A相為例,基于停電相關性系數的計算,A相用戶S3、S4、S5之間停電相關性系數計算結果如表1所示。

表1 停電相關性系數計算結果Tab.1 Outage correlation coefficient calculation results
對同簇內停電相關性系數求和后可知,取系數最高的用戶S3加裝含超級電容器的智能電表。當特征用戶停電時,智能電表實時向主站發送告警信號。
主站在接到告警信號之后,利用采集器實時采集同簇內其余用戶的電表數據,從而分析同簇內其余用戶的停電狀態。由此可基于各特征用戶停電告警的先后順序進行分級研判。
為了驗證本文方法的正確性,本文依據實際電網停電的范圍給出3種不同場景下的停電情況。
臺區特征用戶選擇及裝表情況如圖6所示。

圖6 特征用戶選擇及裝表情況示意圖Fig.6 Feature user selection and meter installation schematic
圖6中,A、B、C三相的聚類結果如圖6中虛線框所示。停電區域如圖6中的3個陰影部分所示。場景一中,C相線路發生單相接地故障,特征用戶S25發出告警信號。通過集中器對其同簇用戶S26、S27、S28分別進行輪詢,發現用戶S26、S27、S28均停電,則判斷停電范圍為圖6中場景一所在陰影區域。場景二中,饋線分支發生三相短路故障,特征用戶S55、S57、S60發出告警信號。集中器對其同簇用戶S54、S56、S58、S59分別進行輪詢,發現4個用戶均停電,則判斷停電范圍為圖6中場景二所在陰影區域。場景三中,當整條饋線發生三相短路故障,特征用戶S81、S86、S87、S91、T4發出告警信號。集中器對其同簇用戶分別進行輪詢,發現14個用戶均停電,則判斷停電范圍為圖6中場景三所在陰影區域。由此表明,本文方法判斷的停電范圍與實際設定停電區域一致。
本文針對配網臺區停電范圍的判定成本高、實施難度大等問題,提出了1種基于特征用戶選擇的停電范圍判定方法,并基于實際算例驗證了所提方法的可行性與有效性。本文所得結論如下。首先,通過綜合考慮SC、CH、DB這3個聚類評價指標,確定最優聚類參數值,以提高臺區聚類的有效性,從而提高停電范圍判定的準確性。其次,通過對停電相關性系數高的用戶加裝智能電表,減少了設備配置,降低了設施投入的成本。所提方法根據各特征用戶停電告警的先后順序進行分級研判,可以準確判斷停電范圍。這提升了低壓臺區的供電可靠性,為低壓配電網的建設提供了參考。