馬草原
(國網天津市電力公司,天津 300000)
電力系統含有龐大的實時數據。這些數據與電力系統的安全運行有著密切聯系,對電力系統的安全與可靠起到決定性作用。電力系統工作過程中需要產生和消耗大量電力能源,在正常工作的情況下依然會產生不良數據影響系統的決策,威脅整個電力系統的安全[1-3]。因此,利用專業技術檢測出不良數據并修正,有助于保證電力系統的正常運行和電力能源的正常供給。
到目前為止,國內外學者對電力能源大數據的檢測和修正作了很多理論與實際研究,總結出兩種使用比較廣泛的修正方法。一種是基于Spark框架的電網運行異常數據辨識與修正方法,通過聚類或神經網絡等數據挖掘算法在大數據中提取出異常數據,在Spark框架下對其進行修正[4]。另一種是基于改進低秩矩陣補全的電網數據缺失值修正方法。這種方法主要根據一定的置信度水平設置閾值,結合概率論相關知識進行假設檢驗,然后通過改進低秩矩陣補全數據缺失值,實現異常修正[5]。
以上兩種方法中存在因過多重復的搜索次數導致數據辨識異常,或將正常數據誤判為不良數據的情況。針對這種情況,設計基于低秩模型的電力能源大數據異常修正方法,解決以往修正方法中存在的問題。
利用低秩模型,在電力能源大數據中去除噪聲數據,分離出含有有利信息的數據[6]。低秩的一般表示形式如下:

(1)
式中:K為系數矩陣;Q為電力能源數據樣本;D為字典[7-8]。
假設在一個時間序列中得到的所有數據將形成一個矩陣,表示為W。設定w為狀態量、A為異常數據矩陣,具有不穩定性和離散特性。在時間序列內,電力能源正常數據呈連續平穩的特征[9-11]。根據上述特征確定初步的目標方程為:

(2)
式中:η為平衡參數,η>0;rank(K)為矩陣K的秩;sparse(A)為矩陣A的一個稀疏約束。
在實際應用中,將D初始化,作為矩陣稀疏約束實例化的范數,計算出目標方程的最小解,也就是低秩模型中最小化矩陣的秩[12-13]。綜上,式(2)可進一步寫為:
(3)
將式(3)作為低秩模型監測異常數據。為了更好地處理電力能源大數據中的異常數據,根據實際需求,將初始化后的D分為兩個部分,一部分用來觀察關鍵量測量數據,另一部分用來觀察非關鍵量測量的異常數據。即:
D=[D1,D2]
(4)
式中:D1為用于表達觀測到的模式;D2為隱藏的潛在模式。
考慮低秩模型中:正常電力能源數據與異常電力能源行為均遵循一定規則;異常數據并不只是胡亂地零散分布,而是表現出一定特征。在處理噪聲數據中,引入特征選擇方法深度挖掘噪聲信息,則最終的目標方程如下所示:
(5)
式中:D1和D2為在已知情況下得到的已劃分數據樣本。
利用目標方程不斷更新數據樣本,并以數據樣本的收斂性作為判斷更新次數是否達到最大的條件。若達到最大更新次數,則停止更新。此時的電力能源數據已滿足檢測辨識和修正對數據的要求。通過上述過程,得到不含噪聲的電力能源大數據樣本。
通過低秩模型得到有規律的電力能源數據,考慮大數據中異常數據的特性,將支持向量機(support vector machine,SVM)作為辨識數據的主要工具,在離線模式和聯機模式下辨識出異常數據。
異常數據與正常數據的區別與數據有功功率和時間的比值相關,計算出某一數據點與該點相鄰點的有功功率和時間的比值。若比值的絕對值大于正常運行狀態下的正常比值,則說明該點數據為異常數據。SVM作為典型的二分類模型,存在訓練和應用兩個階段。采用離線模式訓練SVM,訓練數據來自電力能源數據庫,對數據進行歸一化處理:
(6)
式中:pi為數據庫中第i個數據;pmin為數據庫中的最小值;pmax為數據庫中的最大值;p′i為歸一化后的數據庫中的第i個數據。
將歸一化數據結果作為樣本數據,并對樣本數據進行分塊處理,確保每一個樣本塊內部數據大小基本相同。通過聚類方法處理每個樣本塊中的數據集,獲得對應的聚類結果,并將聚類結果整合。將上述結果看作一個完整聚類集,通過二次聚類后獲得最終的聚類結果。聚類矩陣演變過程如圖1所示。

圖1 聚類矩陣演變過程
對于每一次聚類,記錄類簇包含的所有樣本信息,計算類簇中心矢量:
(7)
式中:n為類簇包含的樣本數;i為聚類次數;gi為樣本i對應的數據矢量;gc為類簇中心矢量。
當聚類完成后,設置閾值ξ。當某個類簇中的數據個數小于設置的閾值時,將該類簇中的數據丟棄。剩下的數據就是具有一定的價值的數據。對于剩余的簇,采用針對性的訓練措施,獲得與簇一一對應的支持向量機模型。
針對剩余的類簇,計算出每個數據點對應的有功功率和時間的比值。對于時間起點和時間終點上的取值,對應的點取前一天或后一天的相鄰值,數據點有功功率和時間的比值計算完成后,標記計算得到的每個數據特征,完成數據樣本訓練。
在各類簇聚類中心對應的數據經過歸一化處理之后,計算聚類中心與對應的時段數據的距離,對比距離的大小并排序,使用與最小距離的類簇數據對應的支持向量機模型,對類簇數據一一分類,得到初步數據辨識結果。在分類完成后,設置一個滑動窗口,接收待處理某一時段電力能源數據。滑動窗口的大小由該時段數據個數確定。當滑動窗口接收數據操作完成后,在類簇中尋找距離最近的時段數據,使用與其對應的支持向量機模型簡單辨識出異常數據。
假設辨識出的時段數據中異常數據的點數為m,默認此時的滑動出窗口邊界處的數據均為正常數據。在此條件下,當時段數據中異常數據的點數小于3時,修正異常數據;當時段數據中異常數據的點數大于等于3時,修正除時間起點和時間終點的所有異常數據。對于時間起點和時間終點的數據,計算其特征值,重新辨識該數據。在重新辨識過程中,如果滑動窗口的上邊界處為異常數據的同時上一窗口未關閉,則時段數據中異常數據點數的計算不僅需要結合當前窗口,還需要將上一窗口的時段數據計算在內。
通過上述過程辨識出電力能源大數據異常數據,電力能源大數據的修正隨著窗口上界和下界的變化進行。
根據基爾霍夫電流定律可知,在電力能源產生和供給過程中,如產生的數據都是正常數據,則有功功率和無功功率互相抵消,相加的總和為零。此時,節點的功率是平衡的。假設母線上有b條支路,第j條支路的有功功率和無功功率分別為Pj和Uj,則節點功率平衡的表達式如下:
(8)
(9)
當線路某側有功確定為正常數據時,則根據式(8)、式(9)修正另一側異常數據:
(10)
(11)
式中:v為b條支路中第v條支路。
若線路兩側均為異常數據,則令與待修正數據點首尾相鄰的點為(x0,y0)、(x1,y1),待修正點為(x,y),根據以下公式修正:
(12)
式中:ε為修正系數。
通過以上方法修正異常數據,適用于單個或多個不相關的異常數據的修正,并且能夠實現零誤差的修正。至此,基于低秩模型的電力能源大數據異常修正方法設計完成。
利用IEEE-30節點系統的數據作為試驗數據,歸一化處理遙感數據。IEEE-30節點電網接線圖2所示。

圖2 IEEE-30節點電網接線圖
采用IEEE-30節點的大型電網數據進行仿真。量測數據主要包括節點注入的有功和無功功率,支路潮流的有功和無功功率。IEEE-30節點量測配置如表1所示。

表1 IEEE-30節點量測配置表
使用不同的電力能源大數據異常修正方法處理量測數據。在量測數據過程中,對組號為3、7、9、15、19的測量節點設置30%的量測誤差值,將其作為異常數據用于后續試驗中,驗證不同的電力能源大數據異常修正方法對異常數據的辨識情況。基于辨識結果,計算不同修正方法的殘差值。
使用不同的電力能源大數據異常修正方法,分別對量測數據進行檢測與修正。通過仿真驗證不同修正方法的負荷數據異常修正效果。電力負荷數據異常修正結果如圖3所示。

圖3 電力負荷數據異常修正效果
分析圖3可知,不同方法下電力負荷數據異常修正效果不同。對于不同時間點來說,電力負荷會發生一定的改變,整體來看,電力負荷先下降后上升再下降。中午12 h時,電力負荷最大。此時電力系統實際負荷為1 325 kW,Spark框架修正方法的電力負荷為1 432 kW,改進低秩矩陣補全修正方法的電力負荷為1 213 kW,本文方法的電力負荷為1 325 kW。經過本文方法修正后,電力負荷與實際負荷值相符。而Spark框架修正方法與改進低秩矩陣補全修正方法的修正效果不理想。經過本文方法修正后的曲線與實際負荷曲線基本重合,而其他方法的負荷曲線明顯存在一定差異。這說明本文方法電力負荷數據異常修正效果最好。這是因為本文方法能夠對不同模式采用不同的方法實現誤差修正,并且通過滑動窗口獲得異常數據,使修正準確性得到提升。
殘差表示觀察值與擬合值之間的差值,可作為誤差的觀測值。殘差值越小表示誤差越小,說明修正的效果效果越好。為此,本文通過殘差值判斷不同方法法修正效果。使用不同的電力能源大數據異常修正方法處理,獲得不同方法在各個量測組的殘差值。不同方法的殘差值如表2所示。

表2 不同方法的殘差值
分析表2可知,不同方法的殘差值不同。當試驗次數為10次時,Spark框架修正方法的殘差值為1.361 4,改進低秩矩陣補全的殘差值1.835 4,本文方法的殘差值0.012,本文方法的殘差值為最低。整體來看,Spark框架修正方法的平均殘差值為1.493 52,改進低秩矩陣補全的平均殘差值為1.884 97,本文方法的平均殘差值為0.009 5。本文方法的殘差值最低,說明本文方法具有較為準確的電力能源大數據異常修正結果。這是因為本文方法采用了低秩模型對電力能源數據樣本進行去噪處理,去除了樣本噪聲,提高了數據結果準確性。
隨著電力輸電系統進入超高壓遠距離輸電、跨區域聯網的新階段,在電力能源大數據中產生了很多異常問題。本文針對這一問題,設計基于低秩模型的電力能源大數據異常修正方法,利用低秩模型展開了一系列的研究。通過與以往使用的修正方法對比試驗,驗證了設計的修正方法在處理電力能源大數據時具有很好的性能,實用性強,簡單易行。