馬 芳,張晨暉
(國網陜西省電力公司榆林供電公司,陜西 榆林 719000)
配電網是我國電力系統的關鍵組成部分,日常運行過程受輸電設備和輸電線路等因素的影響,勢必會產生大量的電能損耗。隨著智能電網技術的迅猛發展,配電網線路損耗越來越大。線損的存在不僅會導致能源浪費,還會影響配電網的供電質量與穩定性。隨著配電網用電終端的不斷加入,需要通過線損大小來衡量經濟性能,因此準確計算配電網線損具有重要的實際意義和價值。近年來,許多學者深入研究配電網線損計算問題,以尋求更準確、更有效的線損計算方法。生西奎等人綜合考慮主客觀因素獲取電氣參數,深度學習并利用門控循環單元(Gate Recurrent Unit,GRU)網絡進行線損計算,結果比傳統誤差反向傳播(error Back Propagation,BP)算法擁有更好的計算性能[1]。程昱舒等人在電力物聯網的全時空量測環境下,采用雙向長短期記憶網絡(Bi-direectional Long short-Tem Memory,BiLSTM)預測線損,解決了傳統線損計算方法異常復雜的問題[2]。雖然已經有很多關于配電網線損計算的研究,但是傳統理論計算方法所需特征參量較為復雜,往往存在計算值與真實值之間誤差較大和計算精度不高的問題。因此,文章提出基于K-Means 聚類和Boosting 算法的配電網線損計算方法,為減少我國電網企業高效管控的潛在損失提供技術支持。
電能由配電網傳輸到用戶的過程勢必會發生損耗,輸電線路的電能損耗尤其嚴重,因此針對配電網減損計算展開深入研究。因為線損是一個沒有具體指標可以直接衡量的數據,所以在進行配電網線損計算時,需要獲取用于線損計算的相關電力參數[3]。配電網日常運行時會產生海量電氣特征參數,如果全部用于線損計算,則將會影響線損計算的效率。因此,引入K-Means 聚類算法聚類分析海量且隨機的配電網運行數據,挖掘與配電網線損計算高度相關的有效電氣特征指標。K-Means 聚類算法主要以歐氏距離為指標度量各運行數據之間的相似度,先進行初始化,在原始配電網運行數據中隨機選取k個數據作為初始聚類中心,然后分別計算原始配電網運行數據各個樣本點和初始聚類中心之間的歐式距離,計算公式為
式中:Dij為配電網運行數據集中樣本個體Xik、Xjk到k個初始聚類中心之間的歐氏距離;N為配電網運行數據的集中樣本數量。
根據各樣本個體與各聚類中心之間的歐氏距離大小,即可劃分歸類樣本,從而形成k個簇,然后求取新簇的樣本均值作為新的聚類中心,再按式(1)重新劃分樣本新聚類中心,以此類推,直至聚類中心的位置不再變化,或者式(2)所求目標函數值收斂至極值即可結束聚類。
目標函數值的計算公式為
式中:f為K-Means 聚類算法收斂判斷的目標函數值;Xn為配電網運行數據集中的第n個樣本,被劃分在m類中;Om為m類的聚類中心。
文章以配電網運行數據為對象,采用K-Means聚類算法進行聚類分析,挖掘配電網的線路負荷有功電量、線路負荷無功電量、線路長度及線路負載率等電氣特征指標。由于這些配電網的電氣特征指標取值范圍與單位不同,為避免數據量綱因素對線損計算結果的影響,通過式(3)標準化處理原始特征指標
式中:X為配電網電氣特征指標的原始值;X'為配電網電氣特征指標標準化處理后的值;為原始配電網電氣特征指標的均值;ε為原始配電網電氣特征指標的標準差。
文章采用K-Means 聚類算法挖掘海量且隨機的配電網運行數據,獲取一系列有價值的電氣特征指標,并通過標準化處理解決不同指標量綱不同的問題,然后用于配電網的線損計算。
基于配電網電氣特征指標,構建一個電氣特征指標與線損率之間映射關系的預測模型,預測計算配電網線損[4]。根據配電網電氣特征指標的實際特點和線損計算需求,引入Boosting 算法構建配電網線損計算預測模型。Boosting 算法是一種依賴決策樹的數據分類算法,屬于機器學習領域,泛化能力極強。利用Boosting 算法構建預測模型,可以最大限度地提升線損計算精度。Boosting 預測模型的關鍵是分類決策樹。基于配電網線損計算的特性,選擇引進C5.0 決策樹,主要采用信息增益作為節點的分割標準。假設Boosting 預測模型的訓練樣本為X={X1,X2,…,Xn},訓練數據集中樣本數目為|X|,那么各數據的期望信息可以根據式(4)獲取,即
式中:E為Boosting 預測模型的訓練樣本期望信息;|Xi|為i類訓練樣本的數目。根據式(4)所求期望信息,即可計算分割訓練樣本時的信息增益為
式中:GI為構建Boosting 決策樹時的信息增益;ΔI為決策樹分類樣本過程中節點分割所需的信息量。
通過式(5)所求信息增益進行節點分割,即可構建決策樹,再以C5.0 決策樹生成基于Boosting 算法的預測模型。預測模型構建成功后,將反映配電網電氣特征指標與線損率關系的樣本數據輸入預測模型,經過預測模型的訓練與調試,即可輸出最佳線損率預測的計算結果[5]。
為驗證所提基于K-Means 聚類和Boosting 算法的配電網線損計算方法的有效性與正確性,選取某地區110 kV 配電網的歷史數據作為實驗數據進行理論線損率的計算實驗。
首先,利用K-Means 聚類算法聚類挖掘實驗配電網中各線路的電氣特征指標,挖掘結果如表1所示。

表1 實驗配電網線路數據聚類結果
其次,將表1 數據作為實驗數據,輸入構建的基于Boosting 算法的配電網線損預測模型,預測計算實驗配電網各線路的線損率,并對比模型輸出的線損率預測計算結果與實際數據的情況,從而判斷設計方法的性能。
為充分說明設計方法配電網線損計算結果的準確性,選擇文獻[1]與文獻[2]方法作為對照組,計算同一配電網內各線路的線損率,對比各方法的線損計算結果,具體如圖1 所示。

圖1 配電網線損計算結果對比
從圖1可以看出,與文獻[1]和文獻[2]方法相比,設計方法和真實數據之間的擬合度更高,且各線路的線損計算值更接近真實值。同時,為客觀評價各方法的計算精度,采用式(6)獲得平均絕對百分比誤差eMAPE作為評價指標,即
式中:eMAPE為實驗配電網線損計算結果的平均絕對百分比誤差;Si為實驗配電網中第i條線路的線損率計算值;Si'為實驗配電網中第i條線路的線損率真實值。
結合圖1 中配電網線損率計算數據和真實數據,采用式(6)計算設計方法、文獻[1]方法、文獻[2]方法的配電網線損計算誤差分別為4.27%、8.53%、10.16%。由此可知,采用K-Means 聚類和Boosting算法進行配電網線損計算,可以有效提升配電網線損的計算精度,驗證了設計方法的可行性與可靠性。
準確計算配電網線損對衡量電網企業運行水平和降低電力損耗具有十分重要的意義。隨著配電網結構的復雜化,傳統線損計算方法的誤差越來越大。為提升配電網線損計算精度,設計了一種基于K-Means聚類和Boosting 算法的配電網線損計算方法。首先,采用K-Means 聚類算法聚類分析配電網運行數據,獲取相應的電氣特征指標。其次,基于Boosting 算法構建一個配電網線損計算預測模型,描述線損率與電氣特征指標之間的映射關系,將挖掘指標輸入模型進行訓練,即可輸出配電網線損的預測計算結果。最后,通過仿真對比實驗驗證設計方法的合理性與實用性,為電網企業制定降損措施提供有效的技術指導。