丁忠安,高 琛,蔣敏敏,林永春,謝國榮,呂 游
(1.國網福建省電力有限公司 電力科學研究院,福州 350009;2.國網信通億力科技有限責任公司,福州 350009;3.華北電力大學 新能源電力系統國家重點實驗室,北京 102206)
配電網線損率是反映電網經濟運行水平的綜合性技術經濟指標之一,配電網線損對電網的經濟運行、無功優化以及輸配電價制定等工作有著重要的影響。隨著用電負荷增加,低壓配電網的線損問題越來越突出。通過分析配電網線損的影響因素,進而得到準確的線損計算方法,不僅有利于降低線損率,提高電能傳輸效率,而且還有利于配電網設計和結構優化,提高電網企業的經濟效益[1]。
配電網線損率的機理計算方法是通過分析配電網中電力損耗設備的物理特性,建立對應的等值模型來計算線損率,其中包括均方根電流法、最大電流法、平均電流法、最大負荷損耗小時法和等值電阻法等方法[2]。由于配電網結構及電力設備特性復雜,在計算線損率時需要較多的等效和假設,從而會造成計算結果的偏差,不便于科學、準確地降損分析。隨著配電網信息化技術的發展,各臺區線路的電壓、電流、功率等電力運行數據已實現了在線測量,采用神經網絡等人工智能技術分析配電網電力運行數據并建立線損率預測模型,可以實現配電網線損率的快速計算。在建立線損率模型時,需要分析線損影響因素來確定模型的輸入變量。現有的方法一般通過定性分析選擇線損的影響因素,但是,臺區配電網線損受多種因素影響,且各因素之間也相互聯系。因此,通過定量分析選擇對線損影響程度較大的因素,對實現配電網線損率的建模和計算都有重要的意義。
偏最小二乘(Partial Least Squares,PLS)是一種新型的多元統計數據分析方法,PLS方法集多元統計回歸、典型相關分析和主成分分析的基本功能為一體,可以同時實現數據結構簡化和變量間相關分析[3,4]。PLS通過尋找與因變量相關性最大的變量組合,提取的主成分具有很好的解釋性并且能夠克服各變量存在多重相關性。通過PLS方法消除多個變量間的相關性,得到全部變量對因變量重要性指標。
本文提出一種配電網線損影響因素的定量分析方法,基于電網數據利用PLS法分析各參數對配電網線損率影響的重要性指標,實現各影響因素的定量表征,為配電網線損率的建模和計算提供變量選取的依據。
配電網線損是指在給定的時間內,配電網各元件消耗的電能。配電網的線損主要包括:線路導線中的損耗,電能表線圈和鐵芯中的損耗,電容器和電纜的介質損耗等,這些損耗主要受電網布局、用電性質及用電負荷等因素的影響。選擇與臺區配電網網架結構和負荷相關的電氣特征參數來作為初始變量,主要包括:臺區變壓器容量x1、臺區用戶數x2、用戶總容量x3、表計數目x4、居民容量占比x5、有功電量x6、無功電量x7、均方根電流x8、氣象溫度x9、氣象濕度x10和氣象風速x11;其中,臺區變壓器容量x1、臺區用戶數x2、用戶總容量x3和表計數目x4反映了網架結構參數對配電網線損率的影響,居民容量占比x5反映了臺區主要的用電性質對配電網線損率的影響,有功電量x6、無功電量x7和均方根電流x8反映了臺區的負荷水平對配電網線損率的影響,氣象溫度x9、氣象濕度x10和氣象風速x11反映了氣象條件對配電網線損率的影響。

表1 電力運行參數變化范圍Table 1 Range of changes in power operating parameters
基于上述分析的特征變量,采集某地區5個臺區低壓配電網時間跨度從2017月8月1日~2017年9月30日,共兩個月的電力運行數據。其中,有功電量和無功電量每日采集一個樣本,均方根電流由各相電流采集后折算成每日一個樣本,氣象溫度、氣象濕度和氣象風速每小時一個樣本,并通過數據融合折算為每日一個樣本,臺區變壓器容量、臺區用戶數、用戶總容量、表計數目和居民容量占比由臺區檔案查詢得到。為了保證所采集數據的真實和有效性,需要對其進行預處理,以避免因數據問題帶來計算誤差[5]。在進行預處理時,考慮以下方面:
1)離群點處理:對于離群點樣本,通過K-means聚類方法來檢測離群點,并對整條數據記錄刪除。
2)缺失樣本處理:對于某變量的缺失樣本,利用該樣本附近的數據樣本進行插值填充;如果該記錄的變量樣本缺失過多,則刪除本條數據記錄。
3)樣本有效性判定:以表計的采集成功率來剔除無效樣本,當該條樣本的電力數據采集成功率低于99%時,則本條樣本記錄無效,應當刪除。
對采樣數據進行預處理和清洗后,最終共得到210條數據樣本,其中各電力運行參數的變化范圍如表1所示。
由表1可以看出,不同變量的變化范圍和量綱均不相同,為了使計算結果不受變量變化范圍和量綱的影響,需對原始數據進行歸一化處理,按照式(1)歸一化到[-1,1]范圍內。

其中,x和x'分別是歸一化前和歸一化后的值,xmax和xmin分別是變量的最大值和最小值。
設樣本容量為n,將上述變量作為自變量,其樣本矩陣記作X∈Rn×p,將線損率作為因變量,其樣本矩陣記作Y∈Rn×1。按照式(2)標準化處理,使樣本均值為0,方差為1。

將自變量和因變量數據標準化后,得到矩陣E0、f0,記t1、u1為E0、f0的第一主成分,w1、c1為E0、f0的第一主軸為單位向量。提取第一個主成分t1、u1,并使t1和u1盡可能攜帶各自變量系統中的變異信息,t1與u1的相關程度能夠達到最大。即有:

用Lagrange法解此優化問題,得到:

由于f0是單變量,則有c1=1,易求w1為:

可得到第一主成分:

然后求得回歸方程:

用殘差矩陣E1、f1取代E0、f0,求第二主成分t2,并依次進行,直至滿足交叉有效性原則。

圖1 線損率影響變量重要性計算流程Fig.1 Line loss rate impact variable importance calculation process
定義變量重要性指標v來表征自變量xi對因變量y的解釋能力和重要程度。

其中,r(y,th)用來計算兩變量之間的Pearson相關系數,m是主成分的個數,是軸wh的第i個元素。
將v進行歸一化,得到歸一化后的各變量重要性指標γ:

將臺區配電網的臺區變壓器容量、臺區用戶數、用戶總容量、表計數目、居民容量占比、有功電量、無功電量、均方根電流、氣象溫度、氣象濕度和氣象風速作為初始特征變量,從配電網電力運行數據采集數據樣本并進行預處理和歸一化,利用PLS方法基于式(2)~式(10)進行變量重要性分析。詳細的流程如圖1所示。

表2 各變量重要性指標值Table 2 Value indicator values for each variable

圖2 各變量的重要性指標歸一化值Fig.2 Normalized values for the importance indicators of each variable
按照上述流程進行計算,經過4次迭代后滿足精度要求,得到PLS各主成分的值,基于式(9)計算各變量的重要性指標值,如表2所示,并按式(10)計算重要性的歸一化值,如圖2所示。由表2和圖2可以看出,配電網的臺區變壓器容量x1、用戶總容量x3和居民容量占比x5對線損率影響最大,這說明網架結構參數及臺區用電性質對配電網線損率有著重要的影響,而臺區用戶數x2和表計數目x4與上述3個變量相比,影響較小。從圖2還可以看出,變量x6和x8的重要性指標也較大,表明有功電量和均方根電流對電網線損率也有一定的影響,即配電網負荷特性也影響著線損率。在氣象因素中,氣象溫度x9對線損率的影響最大,而氣象濕度x10和氣象風速x11的影響相對較小。
通過上述分析,可以用臺區變壓器容量x1、用戶總容量x3和居民容量占比x5來表征配電網網架結構,用有功電量x6和均方根電流x8來表征配電網負荷特性,用氣象溫度x9來表征氣象特性。這樣在進行線損率建模和計算時,便可將11維的影響因素變量降低為6維,而且去除不相關變量,從而簡化計算量并提高計算精度。
提出一種基于偏最小二乘的配電網線損影響因素定量分析方法,基于機理分析,選擇配電網線損率的影響變量,從配電網中采集各變量的電力運行數據,并對數據進行清洗、補全等預處理和歸一化,去除離群點、缺失樣本以及量綱對分析結果的影響,基于PLS算法得到各參數對配電網線損影響的重要性指標,實現各影響因素的定量表征。實驗結果表明,可以將影響配電網線損的11維變量降低為6維,從而為配電網線損率的建模和計算提供變量選擇的依據。